Fantastische Elozahlen mit K=40
Der gerade 14-jährige Amerikaner John M. Burke machte vor kurzem auf sich aufmerksam, weil er in der September-2015-Eloliste des Weltschachbunds FIDE mit 2601 Elo geratet und damit der jüngste Spieler ist, der jemals die 2600er Grenze geknackt hat, womit Wei Yis Rekord der Vergangenheit angehört. Wei Yi ist die große chinesische Nachwuchshoffnung und wird von vielen Experten als kommender Weltmeister gehandelt. Dies brachte dem jungen Burke Schlagzeilen in der Fachpresse und einen Eintrag in der englischsprachigen Wikipedia.
In der Juli-Liste stand Burke noch mit 2258 Elo zu Buche. Das bedeutet, dass er sich in nur zwei Monaten um 343 Punkte gesteigert hat. Nun sind große Leistungssprünge von Jugendlichen nichts Ungewöhnliches. Wei Yi hat von Juli 2012 bis Januar 2013 im Alter von 13 Jahren 100 Punkte zugelegt. Aber 340 Punkte in zwei Monaten? Die Antwort lautet: K=40.
Die FIDE hat in ihren Rating Regulations vom 1. Juli 2014 unter Punkt 8.56 einen kleinen Satz mit großer Wirkung eingefügt:
"K=40 for all players until their 18th birthday, as long as their rating remains under 2300"
Bis zu diesem Zeitpunkt galt die Regel
"K=15 as long as a player's rating remains under 2400"
Wie kann die Erhöhung von K=15 auf K=40 solche Auswirkungen haben? Zum besseren Verständnis möchte ich kurz skizzieren, wie eine Ratingzahl zustande kommt.
Arpad Elo, der Erfinder des Elosystems, ging davon aus, dass die Turnierergebnisse eines Spielers normalverteilt sind. Spielt ein Spieler eine große Anzahl von Turnieren und trägt man seine einzelnen Ergebnisse (Turniererfolgszahlen) gegen ihre Häufigkeit oder Wahrscheinlichkeit auf, mit der sie auftreten, so erhält man die berühmte Gaußsche Glockenkurve, die den Älteren unter uns noch vom 10 DM-Schein her bekannt sein dürfte.
Abb. 1: Gewinnerwartung eines Spielers mit Elo 2200 gegen einen Gegner mit Elo 2000
In Abb. 1 ist die Glockenkurve eines Spielers mit Elo 2200 als blaue Linie dargestellt. Die Glockenkurve ist durch zwei Parameter charakterisiert. Einmal durch den Mittelpunkt, der hier als rote, senkrechte Linie dargestellt ist und in unserem Beispiel bei 2200 liegt. Und zum anderen durch die Standardabweichung s (griechisch Sigma), die ein Maß für die Breite der Kurve ist. Anschaulich gesehen wird durch das Intervall der Abweichung ± s vom Mittelwert eine Fläche von 68,27% der Gesamtfläche unter der Kurve abgegrenzt. Arpad Elo hat die Standardabweichung per definitionem auf 282,84 gesetzt. Ich möchte hier nicht darauf eingehen, wie diese krumme Zahl zustande kommt. Interessierte können das z.B. in Arpad E. Elo, The Rating of Chessplayers, 1978, nachlesen.
Zur Berechnung der Elozahl benötigt man die Gewinnerwartung, die ein Spieler gegen einen ebenfalls Elo-gewerteten Gegner hat. Nehmen wir an, der Gegner hat Elo 2000. In Abb. 1 ist dies durch die grün gestrichelte, senkrechte Trennlinie dargestellt. Die Gewinnerwartung des Gegners ergibt sich nun als die Fläche unter der Kurve, die sich links von dieser Trennlinie befindet. Diese ist blau unterlegt. Die Fläche, die sich rechts von der grünen Trennlinie befindet, ist die Gewinnerwartung des stärkeren Spielers mit Elo 2200. Sie ist gelb unterlegt. In unserem Beispiel beträgt die gelb unterlegte Fläche 0,76 oder 76% der Gesamtfläche unter der Kurve. Da die Gesamtfläche 1 oder 100% ist, ist die Gewinnerwartung des schwächeren Gegners 0,24 oder 24%. Anschaulich bedeutet das: Wenn ein Spieler mit Elo 2200 gegen einen Gegner mit Elo 2000 eine große Anzahl von Partien, sagen wir 100, austrägt, dann ist ein Ergebnis von 76:24 zu erwarten.
In gleicher Weise lassen sich für jede andere Elo-Differenz die Gewinnwahrscheinlichkeiten als Flächenwerte darstellen.
Die FIDE bezeichnet die Gewinnerwartung als PD (score probability). Das Ergebnis einer Partie oder der "score" (FIDE) kann Gewinn, Remis oder Verlust, also 1, 0,5 oder 0 sein. Wenn man nun die Gewinnerwartung vom tatsächlich erzielten Ergebnis abzieht, dann erhält man den Wert DR (auch change oder chg), der der Berechnung der neuen Elozahl zugrunde liegt. Es gilt:
DR = score – PD
Wenn in unserem Beispiel für den stärkeren Spieler also PD = 0,76 ist und die Partie Remis endet, dann ergibt sich ein DR-Wert von -0,26, bei einem Gewinn von +0,24 und bei einem Verlust von -0,76.
Wie errechnet sich nun aus dem DR-Wert die tatsächlich gewonnene oder verlorene Elo-Punktzahl (FIDE: Rating Change)? Jetzt kommt der K-Wert (FIDE: development coefficient) ins Spiel.
Rating Change = K x DR
Nehmen wir an, unser Spieler mit Elo 2200 gewinnt die Partie. Dann ist sein DR-Wert +0,24. Bei K=40 gewinnt er dadurch 0,24 x 40 = 9,6 Elopunkte, bei K=15 wären es nur 3,9 Punkte gewesen.
Nach einem Turnier mit z.B. 9 Partien werden alle 9 DR-Werte mit K multipliziert und aufaddiert bzw. subtrahiert. Daraus ergibt sich die neue Elozahl. Die Formel lautet:
Rn = R0 + S DR x K
Rn = neue Elozahl
R0 = alte Elozahl
S DR x K = Summe aller Rating Changes, wobei S (griechisch Groß-Sigma) für Summe steht
Anschaulich gesehen ist der K-Wert ein Gewichtungsfaktor, der angibt, wie stark das letzte Turnierergebnis die neue Elozahl beeinflusst. Umso höher der Wert liegt, desto stärker ist der Einfluss des letzten Turnierergebnisses auf die neue Elozahl.
Wie errechnen sich nun die einzelnen Gewinnerwartungen PD? Wenn man keine Spezialsoftware zur Hand hat, kann man die Werte aus der Tabelle 8.1b der FIDE Regularien entnehmen. Moderne Office-Programme wie z.B. Microsoft Office oder die kostenlose Apache OpenOffice-Software, die ich hier in der Version 4.1.1 verwende, bieten für alle möglichen mathematischen und statistischen Probleme vorgefertigte Funktionen, die man über das Menü Einfügen > Funktion aufrufen kann. Mit der Funktion NORMVERT in Calc, dem Excel-Pendant von OpenOffice, lassen sich die Flächenwerte unter der Normalverteilungskurve und damit die Gewinnerwartungen einfach berechnen.
Die Syntax lautet:
NORMVERT (Zahl;Mittelwert;STD;F) mit
Zahl = der jeweilige x-Wert = die Elozahl des Gegners
Mittelwert = der Mittelwert der Normalverteilung = Elozahl des Spielers, für den die Auswertung erstellt wird
STD = die Standardabweichung der Normalverteilung = 282,84
F = 0, berechnet die y-Werte der Normalverteilung
1, berechnet die Flächenwerte = Gewinnerwartungen
Die Funktion NORMVERT liefert immer die Flächenwerte, die links von der Trennlinie (Abb. 1) liegen. In unserem Beispiel ergibt NORMVERT(2000;2200;282,84;1) den Wert 0,24 also die Gewinnerwartung des Gegners mit Elo 2000. Die Gewinnerwartung des Spielers, für den die Auswertung erstellt wird, erhält man, indem man diesen Wert von 1 subtrahiert.
Ich möchte das an einem Beispiel demonstrieren und zwar an einem Turnier, das Burke im Juli 2015 gespielt hat.
Abb. 2: Eloauswertung Burke, 43th Annual World Open, Arlington, Juli 2015
Burke hat in diesem Turnier mit acht Partien 120 Elo-Punkte gewonnen. Die mit der Funktion NORMVERT in OpenOffice, Calc, errechneten Werte (Spalte L in Abb. 2) stimmen gut mit den offiziellen FIDE-Zahlen überein (Spalte M). Die geringen Abweichungen sind darauf zurückzuführen, dass NORMVERT die exakten Zahlen liefert, während die FIDE gerundete Tabellenwerte verwendet. Spalte N zeigt die Auswertung nach alter Regel also mit K=15. Burke hätte danach nicht 120 sondern nur 45 Punkte gewonnen. Der Unterschied, der durch K=40 verursacht wird, ist offensichtlich gravierend.
Im Zeitraum Ende Juni bis Ende Juli 2015 hat Burke vier Turniere gespielt die alle mit K=40 und R0=2258 ausgewertet wurden. Das hat ihm die eingangs erwähnten 343 Punkte eingebracht. Wären die Turniere nach der bis zum 01.07.2014 gültigen Regel ausgewertet worden, hätte der Elo-Zuwachs nur 129 Punkte betragen. Seine derzeitige Elozahl wäre dann 2387 statt 2601. Ein gewaltiger Unterschied! Wei Yis Elozahl lag im gleichen Alter, also mit Anfang 14 Jahren, übrigens bei etwa 2550. Es ist natürlich offensichtlich, dass Wei Yis 2550 (K=15) in der Realität deutlich höher einzustufen sind als Burkes 2601 (K=40) und die Überlegenheit von Burkes Wertung nur auf dem Papier besteht.
Der erfahrene Turnierspieler weiß, dass auf drei gute Turniere meist drei schlechte folgen. Der K=40-Faktor bewirkt selbstverständlich, dass schlechte Turniere genauso überratet sind wie gute und unter dem Strich würde sich K=40 nur in einer höheren Schwankungsbreite der Elozahlen bemerkbar machen, einer Schwankungsbreite, die allerdings realitätsfremd ist. In den FIDE-Regularien ist aber unter Punkt 8.56 ein Passus enthalten, der genau dies verhindert. Dort heißt es:
"K=10 once a player's published rating has reached 2400 and remains at that level subsequently, even if the rating drops below 2400"
Dies hat zur Folge, dass die Ratings von jungen Spielern zunächst mit K=40 in astronomische Höhen katapultiert und dann mit K=10 dort einzementiert werden.
Burke ist kein Einzelfall. Ein besonders krasses Beispiel ist der Aserbaidschaner Parvis Gasimov, Jahrgang 2000, der seine Elozahl von Oktober 2014 bis Januar 2015 von 1949 auf 2517 gesteigert und in einem einzigen Turnier stolze 211,6 Punkte zugelegt hat und das zu einem großen Teil gegen Gegner, die deutlich unter 2000 gelistet waren.
Zusammenfassung:
Die grundlegende Errungenschaft des Elo-Rating-Systems besteht darin, dass es die Spielstärken aller Spieler verschiedener Nationen transparent und vergleichbar macht. Dies wird durch die Änderung des K-Faktors von 15 auf 40 bei Spielern unter 18 Jahren zum 01.07.2014 in den FIDE-Rating-Regulations konterkariert und hat bei vielen Betroffenen zu völlig realitätsfremden Elozahlen geführt. Die Kontinuität und Integrität des gesamten Systems ist dadurch langfristig gefährdet. Die Verantwortlichen der FIDE sollten diesen Fauxpas möglichst schnell wieder rückgängig machen und den alten Zustand mit K=15 wiederherstellen.