Elo-Inflation oder -Deflation?

von ChessBase
06.10.2021 – Walter Wolf hat in seinen Beiträgen einiges Material zur Betrachtung der Elozahlen und ihrer Entwicklung geliefert. Auch die Hamburger Dirk Sebastian (HSK) und Martin Voigt (St. Pauli) haben ausführlich die Tendenzen der Elozahlen untersucht und fassen hier anknüpfend an Walter Wolf ihre Ergebnisse zusammen.

ChessBase 17 - Megapaket ChessBase 17 - Megapaket

ChessBase ist die persönliche Schach-Datenbank, die weltweit zum Standard geworden ist. Und zwar für alle, die Spaß am Schach haben und auch in Zukunft erfolgreich mitspielen wollen. Das gilt für den Weltmeister ebenso wie für den Vereinsspieler oder den Schachfreund von nebenan.

Mehr...

Von Martin Voigt

Gibt es Elo-Inflation oder -Deflation?

Seit geraumer Zeit umtreibt die Schachgemeinde die Frage, ob sich das Niveau der Elo-Zahlen verschiebt. Wir möchten eine weitere Perspektive zur Diskussion beisteuern.

Einleitung

Ist ein Spieler mit einer Elo-Zahl von 2600 in den Neunzigern oder den Jahren nach der Jahrtausendwende mit einem 2600er heutzutage vergleichbar? War er stärker oder schwächer?

Einerseits gibt es heute deutlich mehr Spieler mit 2600+ oder gar 2700+ als vor 20 oder 30 Jahren, was darauf hindeutet, dass diese Zahlen heutzutage einfacher zu erreichen sind. Andererseits gibt es mit stärkeren Engines, umfangreichen Datenbanken und dem Internet erheblich bessere Trainingsmethoden. Außerdem ist die Zahl der Menschen gestiegen, denen sich aufgrund ihrer Lebensumstände überhaupt die Möglichkeit bietet, Großmeisterstärke zu erreichen.        

Vorgehen

Um Spielstärken zu messen, haben wir mehrere Hunderttausend Partien mit Stockfish analysiert und den Centipawn Loss (cpl) für jeden Zug berechnet. Der cpl ist die Differenz zwischen der Stellungsbewertung nach dem laut Stockfish besten und dem gespielten Zug.[1] Auch wenn der durchschnittliche cpl (acpl für average cpl) bei der Ermittlung der Spielstärke nur die halbe Wahrheit ist, weil die Komplexität der Stellungen außer acht gelassen wird, ist der acpl in diesem Fall, in dem wir eine große Gruppe an Spielern und Partien betrachten, eine brauchbare Metrik.

Bild 2600 umfasst alle Spieler mit Elo 2551-2650

DieY-Achse gibt den acpl, also den durchschnittlichen Fehler wieder. Man sieht, dass der acpl in den letzten Jahren gesunken ist.

Das fehlerfreiere Spiel basiert nicht bloß auf besseren Theoriekenntnissen.

In dieser Grafik ist der acpl für Spieler um 2600 nach dem Zeitraum und nach der Zugnummer abgebildet. Die Züge wurden in 5er-Schritten zusammengefasst, d.h. der Wert bei Zug 35 umfasst die Züge 31-35. (Typischerweise ist der acpl direkt vor der Zeitkontrolle am höchsten, daran hat auch die Einführung des Inkrements nichts geändert.)

Man sieht, dass in jüngeren Jahren auch Mittel- und Endspiel besser beherrscht wurden.

Das Sinken des acpl lässt sich nicht nur bei starken Großmeistern und Profis beobachten, sondern in allen Rating-Bereichen.

Resümee: In diesem Jahrtausend ist eine Rating-Deflation zu erkennen. Ein Spieler im Jahre 2019 war stärker als ein Spieler mit identischer Elo-Zahl vor 20 Jahren.

Was ist passiert?

Im Jahre 1993 senkte die FIDE die Mindest-Elo von 2205 auf 2005, 2001 auf 1800, im Jahre 2004 auf 1600, und 2006 auf 1400. Später wurde die Mindest-Elo sogar auf 1000 heruntergesetzt. Zwischen 1993 und 2004 änderte sich der acpl von Spielern mit vergleichbarem Rating nicht signifikant.

Nach Herabsetzung der Mindest-Elo auf 1600, verringerte sich der acpl.

Erklärungsversuch

Heutzutage bekommen viele junge Spieler eine Elo, die noch in der schachlichen Entwicklung stecken. Diese jungen Spieler steigen mit einer kleinen Zahl ein, die im Laufe der Zeit wächst. Dabei entziehen sie den anderen Spielern Rating-Punkte, was zu einer Deflation führt.

Zwar haben Jugendliche einen höheren k-Faktor, d.h. ihre Zahl ändert sich schneller, das hält sie aber nicht davon ab, anderen Spielern Punkte wegzunehmen.

Änderungsvorschlag

Jugendliche und Spieler mit wenigen Auswertungen, die in einem Turnier deutlich besser abschneiden als ihr bisheriges Rating, könnten mit ihrer Performance ausgewertet werden. Auf diese Weise würden erfahrene Spieler nicht lediglich deshalb Punkte verlieren, weil ihr Gegner unterbewertet ist.

[1]Wir haben den cpl auf 500 beschränkt.

 


Diskutieren

Regeln für Leserkommentare

 
 

Noch kein Benutzer? Registrieren