Probleme der Elo-Berechnungen bei Jugendlichen

von Walter Wolf
28.02.2019 – Innerhalb der verschiedenen Elo-Welten gibt es Subsysteme, die eigenen Gesetzen gehorchen. Warum, zum Beispiel, sind junge Spieler aus Indien oder auch Russland zum größten Teil unterbewertet? Walter Wolf hat sich die Entwicklung der Elogesamtzahlen und einiger Subsysteme gründlich angesehen und beleuchtet verschiedene Effekte - ein Diskussionbeitrag.

ChessBase 18 - Megapaket ChessBase 18 - Megapaket

Das Wissen, das Du jetzt brauchst!
Die neue Version 18 bietet völlig neue Möglichkeiten für Schachtraining und Analyse: Stilanalyse von Spielern, Suche nach strategischen Themen, Zugriff auf 6 Mrd. LiChess-Partien, Download von chess.com mit eingebauter API, Spielervorbereitung durch Abgleich mit LiChess-Partien, eingebaute Cloud-Engine u.v.m..

Mehr...

Elo-Zahlen auf dem Rückzug?

Eine Untersuchung über die Auswirkung des abgesenkten Rating-Floors auf  die Elo-Zahlen

Verfolgt man das weltweite Schachgeschehen, so fallen einem immer wieder Spieler auf, deren niedrige Elo-Zahl nicht so recht zur Turnierleistung passt. Es gibt scheinbar abhängig vom Land unterschiedlich starke Unterbewertungen und wohl auch unterschiedliche Begründungen dafür. Anlässlich meines Berichts über das Schach in Indien habe ich mich mit den  Regeln der Elo-Berechnung  befasst  und Schachspieler befragt, die sich für das Thema interessieren.

Vorliegender Bericht untersucht die Auswirkung des abgesenkten Rating-Floors (Mindest-Elo) auf die Elo-Zahlen, ein Thema, das selten im Blickfeld des  öffentlichen Interesses stand, obwohl dies die Anzahl jugendlicher Elo-Träger deutlich erhöht. Das Elo-System macht darauf einen etwas unvorbereiteten Eindruck, und es stellt sich die Frage, ob die Regeln der Elo-Berechnung den Spielstärkeanstieg der Jugendlichen ausreichend beschreiben.

Die hier gemachten Auswertungen erfolgten mit den im FIDE-Archiv hinterlegten Spielerdateien, die bis 2001 zurückreichen. Die Daten vor 2001 stammen von der Webseite OlympBase. Es wurden jeweils die Januar-Listen für statistische Auswertungen herangezogen. Den Status (i)naktiv bekommt ein Spieler bei der FIDE, wenn er in den vorherigen 12 Monaten keine Elo-Auswertung hatte. Ist nachfolgend der Status nicht gesondert aufgeführt, so handelt es sich um aktive Spieler.

Die Entwicklung der Elo-Zahlen seit 1970

Um für den Leser die Entwicklung der Elo-Zahlen etwas transparenter zu machen zuerst ein Blick in die Geschichte.

Das Elo-System wurde 1970 von der FIDE übernommen, erst 1986 erreichte man die Anzahl von 5000 Elo-Trägern. Nicht jedes Land hat so konstante Mitgliederzahlen wie Deutschland, weltweit bauen sich die Alterspyramiden bei den Elo-Trägern weiterhin auf, selbst die Ausbreitung in alle Länder der FIDE ist noch nicht abgeschlossen.

 

Indien hat 82000 bei der FIDE registrierte Spieler, davon sind 40514 Jugendliche.  In Russland sind ebenfalls über die Hälfte der aktiven Elo-Träger Jugendliche. Die USA und China scheinen sich bei ihren inländischen Turnieren etwas außerhalb des Elo-Systems zu bewegen. Der US-Schachverband (USCF) gibt seine Mitgliederzahl mit 90000 an, hat aber nur ca. 2500 aktive Elo-Träger. Auch England hat überraschend wenig Elo-Träger. Die aktivsten Schach-Senioren (60+) findet man in Deutschland, 3229 Senioren haben 2019 den aktiv-Status! Mit den inaktiven Spielern kommt Deutschland auf insgesamt 25160 Elo-Träger, deren Elo-Niveau von 1882 liegt knapp 100 Punkte über dem DWZ-Niveau dieser Spieler. Das Land mit den meisten Elo-Trägern ist Spanien. Nimmt man jedoch die auf passiv-Status stehenden Spieler mit hinzu, so führt Russland überlegen mit 32730 Elo-Trägern, darunter auch viele Jugendliche mit passiv-Status.

Man kann die Zeit seit der Elo-Einführung im Jahre 1970 in 2 Phasen einteilen:

Die erste Phase der Ausbreitung von 1970 bis ca. 2000 war begleitet von einem starken Anstieg der Elo-Zahlen. In den Top 1000 setzte sich dieser Anstieg sogar bis 2012 fort. Für die Ursache dieses Anstiegs der Elo-Zahlen findet man keine klare Begründung. Es ist aber auch nicht zu übersehen, dass es heute einfach mehr starke Großmeister gibt als 1980. Siehe Länder wie Frankreich oder China. 1990 gab es keinen Chinesen in den Top 100, nimmt man heute China aus der 2019er-Liste so würde das Niveau der Top 100 von 2703 auf 2696 sinken.

Die 2.Phase der Ausbreitung  ist von der Absenkung des Rating-Floors (Mindest-Elo) geprägt, was zu einem starken Anstieg meist jugendlicher Elo-Träger geführt hat. Die Elo-Zahlen in den Top 1000 haben sich in dieser Zeit recht stabil gehalten, in tieferen Bereichen sinkt das Niveau jedoch, fast unbemerkt von der Öffentlichkeit.  Man fokussiert sich vielleicht auch zu sehr auf die Top 100 und auf die Anzahl GM- und IM-Titelträger, deren Anstieg weiter anhält:

Der starke Anstieg  an Titelträgern ist wohl auch eine Folge der starken Zunahme an Spielern mit einer Elo-Zahl und der Zunahme von Turnieren, bei denen man solche Normen erzielen kann. Die Koppelung zwischen Titelnorm und Elo-Zahlen ist für die FIDE ein Grund, die durch die Elo-Zahl ausgedrückte Spielstärke einigermaßen mit früheren Zeiten vergleichbar zu halten.

Wie sieht es also weltweit mit den Zahlen in den tieferen Elo-Rängen aus?

Die Top 1000 haben sich in den letzten 7 Jahren auf einem hohen Niveau eingependelt.

In den Top 20000 bis 40000 sind die Elo-Niveaus abnehmend, trotz stark gestiegener Gesamtspielerzahlen!

Auch die Sicht auf die Spieleranzahl je Elo-Bereich zeigt im Bereich 2000-2400 rückläufige Werte.

Um vorliegenden Bericht nicht mit Tabellen zu überladen, wird auf eine weitere Tabelle mitsamt den passiven Spielern verzichtet.  Nimmt man die Inaktiven mit in die Liste, so beantwortet dies die Frage wo die Spieler in den abnehmenden Elo-Bereichen geblieben sind. Da ein Spieler auf Lebenszeit in der Elo-Liste bleibt, summieren sich natürlich die im Lauf der Jahre inaktiv gewordenen Spieler hoch. Insgesamt sind 2019 etwa 160000 Spieler als inaktiv gekennzeichnet, von denen etwa 60000 Spieler seit mehr als 5 Jahren keine Elo-Wertung mehr hatten. Nicht wenige haben seit 10-20 Jahren eine unveränderte Elo-Zahl, da man bis zum Lebensende in der Liste bleibt. Da also viele dieser Spieler seit langem inaktiv sind, haben viele von ihnen auch eine Elo-Zahl über 2000, gemäß dem damaligen Rating-Floor als diese Spieler noch aktiv waren. Die Frage warum diese Spieler inaktiv wurden, kann hier nicht beantwortet werden. Eher wirft dies eine weitere Frage auf: warum konnten die Nachwuchsspieler in den letzten Jahren diesen Rückgang im Bereich 2000-2400 nicht ausgleichen, sintemal sich gleichzeitig die Anzahl der aktiven Elo-Träger in den letzten 10 Jahren beinahe verdreifacht hat?

Um den verzerrenden Effekt neu hereinkommender Spieler oder ausscheidender Spieler auszuschließen, wird nachfolgend untersucht wie sich die Zahlen der aktiven Spieler  in den Folgejahren ändern. Von den Spielern aus 2002 werden dabei nur diejenigen betrachtet, die auch im Jahr 2009 noch als Elo-Träger geführt werden. Ob diese Spieler dann in 2009 aktiv oder inaktiv sind, spielt für die Betrachtung keine Rolle.  Es ist nur wichtig zu verstehen, dass es sich im betrachteten Zeitraum um dieselben Spieler handelt. Über die FIDE-ID lässt sich der Werdegang der Spieler verfolgen. Dieselbe Vorgehensweise gilt auch für Tabelle 6, dort im Zeitraum 2012-2019.

Während die Daten 2002-2009 nur leichte Rückgänge zeigen (der Rating-Floor wurde ja 2004 abgesenkt), sind bei der Betrachtung des Zeitraums 2012-2019 die Elo-Zahlen insgesamt abnehmend. Bei den Spielern, die sich 2012 im Alter von 20-35 befanden, wäre in den folgenden sieben Jahren eher ein leichter Anstieg des Elo-Niveaus zu erwarten gewesen, wie schon im Zeitraum 2002-2009. Überraschend sinkt auch in dieser Altersgruppe der weltweite Elo-Durchschnitt  um 7 Punkte. Trotz des höheren Alters bleiben die Zahlen Deutschlands erstaunlich stabil.

Eindeutig deflationär dagegen die Zahlen der indischen Spieler, die sich eigentlich im besten Schachalter befinden.

Obige Einteilung ist für Indien etwas unpassend. Eine Altersbetrachtung erbringt für 2012 folgende Ergebnisse:

Die 216 Spieler im Alter von 7-10 Jahren verbesserten von 2012 bis 2019 ihr Niveau von 1411 auf 1659.

Die 2395 Spieler im Alter von 11-20 verbesserten bis 2019 ihr Niveau von 1582 auf 1620.

Die 2112 Spieler im Alter ab 21 verschlechterten bis 2019 ihr Niveau von 1751 auf 1655!

Diese Bilanz scheint nicht zum K=40 der Jugendlichen zu passen. Die hier betrachteten Spieler sind aber kein geschlossenes System, sondern im betrachteten Zeitraum hatte Indien einen enormen Zuwachs an Elo-Trägern.

Im nachfolgenden Kapitel wird versucht die Unterbewertung mit der Altersstruktur im indischen Schachverband  zu begründen.  Dabei stellt sich allerdings die Frage, warum Russland mit seinem hohen Jugendanteil nicht ähnlich deflationär ist. Zur Beantwortung dieser Frage ist wohl ein Russland-Fachmann notwendig. Beim Betrachten der russischen  Zahlen bekommt man den Eindruck, dass die Einstiegs-Elo in Russland meist deutlich höher liegt als in Indien.  In Indien hat sich im Bereich unter Elo 1200 eine größere Gruppe gebildet, die älter ist als 18 und die ihr Niveau nur schwerlich steigern dürfte.  

Das Absenken des Rating-Floors auf 1000

Der Rating-Floor (Mindest-Elo) lag zu Beginn bei 2200 und wurde schrittweise abgesenkt. Dies  bewirkte ein immer niedrigeres Eintrittsalters in die Elo-Liste. Bekam man früher mit vielleicht 20 Jahren eine Elo-Zahl, so bekommt man diese heute bereits mit 12 und jünger. Man kann wohl sagen dass jedes Turnier, das ein Jugendlicher spielt, zur Verbesserung seiner Spielstärke beiträgt. Dennoch bleibt nach einem Jugendturnier das Gesamtniveau der jugendlichen Teilnehmer unverändert, da sie denselben K-Faktor haben. Damit wird die Realität nur unvollkommen abgebildet.

Gerade im Alter von 10 bis 18 ist der Spielstärkeanstieg am stärksten, man nimmt nun also (im Gegensatz zu früher) in diesen Jahren anderen Spielern Elo-Punkte ab. Ein Teil davon kommt von Jugendlichen die wegen schlechter Ergebnisse wieder mit dem Schach aufhören. Da sich die Spielstärke aber bei praktisch allen anderen Jugendlichen in den Jahren von 10 bis 18 erhöht, sind es vorwiegend die Erwachsene Gegner die diesen Elo-Anstieg der Jugendlichen „finanzieren“. In der Folge entstand im neu geschaffenen Elo-Bereich 1000-2000 eine Unterbewertung, die wohl auch in den darüber liegenden Elo-Bereich wirkte.

Also erhöhte man 2014 für Jugendliche den K-Faktor auf 40. Beim Sieg  eines Jugendlichen (K=40) gegen einen Erwachsenen (K=20) verbessert sich dieser nun um das doppelte dessen, was sich der Erwachsene verschlechtert. Der Jugendliche nähert sich damit schneller seiner Spielstärke an, ebenso steigt dadurch das Elo-Gesamtniveau.

Der heutige K=40 wirkt sich vor allem dort aus, wo die Jugendlichen mehr  Erwachsene Gegner haben, hier können sie beweisen dass Ihre Spielstärke ihrer Elo-Zahl vorauseilt.  Die Wirkung von K=40 hebt aber den dämpfenden Effekt der Jugend auf die Elo-Zahlen der etablierten Spieler nicht komplett auf. Bei einem heutigen weltweiten Elo-Durchschnitt von ca. 1600 sollte ein Jugendlicher der mit Elo 1000 beginnt, in den Folgejahren durchschnittlich um 600 Punkte steigen. K=40 kann die Finanzierung dieses Zuwachs zwar halbieren, die fehlenden Punkte dürften aber von den Gegnern kommen, die bereits ihr Spielniveau erreicht haben (und deshalb gegen unterbewertete Gegner ihre Elo-Erwartung nicht erfüllen können). Unklar ist die Auswirkung der Jugendlichen die Elo-Punkte abgeben und in der Folge mit dem Schach aufhören.

Schon Arpad Elo (1903-1992) sprach von einer deflatorischen Wirkung der Jugendlichen auf die Elo-Zahl.

Betrachtet man eine einzelne Partie eines Erwachsenen gegen einen Jugendlichen, so führt nur der Anteil der Unterbewertung des Jugendlichen zu einem unverdienten Verlust an Elopunkten („undeserved losses“). Schachfreund Berthold Plischke gab mir hierzu folgendes Rechenbeispiel:

Jugendlicher J (ELO 1600) gewinnt gegen Erwachsenen E (ebenfalls 1600). Dann gewinnt J 40*(1-0,5) = 20 Punkte, E verliert 20*(0-0,5) = -10. Allerdings sind die 10 Punkte Verlust nicht komplett unverdient: Angenommen J hätte bereits die Spielstärke 1700 (bzw. 1800). Dann hätte E eigentlich 20*(0 - 0,36) = - 7,2 verlieren müssen. Also hat er nur ca. 3 Punkte unverdient verloren (bei J = 1800 echt wären es ca. 5 unverdiente Verlustpunkte).

Eine reduzierte Wirkung des K-Faktors zeigt das Beispiel der Jugendlichen in Indien. Die Mitgliederzahl des indischen Schachverbandes hat sich in den letzten 2 Jahren um 30% erhöht! Die Neumitglieder werden wohl keine Rentner sein. Also viele Jugendliche, kaum Kontakt zum Ausland. Folglich gibt es prozentual weniger Spiel-Begegnungen zwischen Jugendlichen und Erwachsenen, vermehrt jedoch Begegnungen der Jugend untereinander. Das Niveau kann sich aber nur ändern, wenn Spieler mit unterschiedlichen K-Faktoren gegeneinander spielen. Angesichts der Expansion im indischen Jugendbereich dürfte damit auch zukünftig der Anstieg des Elo-Niveaus der indischen Jugendlichen gedämpfter erfolgen als der in Deutschland. Im ungünstigsten Fall verstärken sich die Bewertungsunterschiede sogar. In diesen inner-indischen Begegnungen Jugend-Erwachsene dürften zudem die Erwachsenen schlechte Karten haben.

Auch der DSB hatte eine solch starke Anstiegs-Phase wie Indien, in den Jahren 1951-1991 ging es von 25000 auf 90000. Damals gab es jedoch noch keine Elo-Zahlen oder der Rating-Floor war für die meisten Jugendlichen zu hoch.

Sie können sich ja mal selber folgende Frage beantworten: Wenn man 100 30-jährige Elo-Träger mit einen Elo-Schnitt von 1800 nimmt und diese in den nächsten 10 Jahren nur gegeneinander spielen lässt, was ist dann das Elo-Niveau dieser 40jährigen? Und dann nimmt man 100 10-jährige mit einem Elo-Schnitt von 1100 und lässt diese in den nächsten 10 Jahren nur gegeneinander spielen, was haben die 20-jährigen dann für ein Elo-Niveau? Eine ähnliche Situation gibt es ja im Seniorenschach, wo man viel untereinander spielt, was das Elo-Niveau dort etwas konserviert.

Vorschläge zur Berechnung der Elo-Zahl

Mein Dank geht besonders an Schachfreund Berthold Plischke, dem DSB-Referenten für DWZ-Systemkontrolle -ein kompetenter Wertungsfachmann, dessen Ratschläge zur Verbesserung dieser Betrachtung mir sehr willkommen waren. Dadurch, dass bei der DWZ-Ermittlung ein Spieler bis ins Alter von 25 mit Sonderregeln begleitet wird, ist in der DWZ die Integration der Jugend besser gelöst. Mit 25 dürfte man seiner erreichbaren Spielstärke nahe gekommen sein. Außerdem war die Jugend von Anfang an im DWZ-Rating-Pool integriert, so dass sich für die FIDE vielleicht ein Blick auf die dortige Vorgehensweise lohnt. Eine interessante Möglichkeit, um der Unterbewertung gegenzusteuern, kommt seit 2016 in der DWZ-Berechnung zur Anwendung: Liegt die Turnierleistung eines Spielers um mindestens 300 Punkte über seiner vorherigen DWZ, so wird zur DWZ-Berechnung seiner Gegner seine Turnierleistung und nicht seine DWZ verwendet.

Maßnahmen zur Anhebung der Elo-Zahlen

1987 wurden die Elo-Zahlen aller Frauen (außer Susan Polgar) um 100 Punkte erhöht. Es wäre zu überlegen ob man so etwas auch mit Ländern machen kann, die als unterbewertet eingestuft sind. Eine solche Erhöhung müsste sich natürlich auf den niedrigen  Elo-Bereich beschränken und dort mit Abstufungen erfolgen.

So will man demnächst beim DSB zu niedrige erste DWZ von Einsteigern auf Werte knapp unter 1000 anheben. Man nimmt eine mögliche Überbewertung dieser Spieler in Kauf, davon profitieren in der Folge ihre künftigen Gegner.

Solch eine Erhöhung der Start-Elo wäre wohl auch für ein Land wie Indien ein geeignetes Mittel um von unten her der in diesem Bereich  starken Unterbewertung gegenzusteuern.

Der K-Faktor für Jugendliche

Um den Spielstärkezuwachs in jungen Jahren besser zu berücksichtigen, könnte man bei einer Partie zwischen zwei Jugendlichen den K-Faktor für den Sieger leicht erhöhen und den K-Faktor des Verlierers leicht senken. Der Sieger würde sich damit mehr verbessern, als der Verlierer sich verschlechtert, das Gesamtniveau steigt. Man müsste dabei allerdings auch der Manipulation gegensteuern, da damit das reine spielen in einem Jugendturnier belohnt wird (zwei Jugendliche spielen gegeneinander 10:10 ohne remis, beide Spieler verbessern sich).  Diese Regel könnte aber auch ein Anreiz sein mehr Jugendturniere mit Elo-Auswertung zu veranstalten. Und mehr auf Sieg zu spielen.

Ein ähnlicher Bonus ist beim Spiel Erwachsener gegen Jugendliche notwendig, denn nur durch die Erwachsenen kann das Elo-Gesamtniveau der Jugend steigen.

Beispiel:

Bisher: Jugendlicher (K=40) gegen Erwachsenen (K=20)

Neu  :   Jugendlicher (K=35) gegen Erwachsenen (K=18 bei Verlust, K=20 bei remis, K=22 bei Sieg)

              Jugendlicher gegen Jugendlicher  (K=32 bei Verlust, K=35 bei remis, K=38 bei Sieg)             

Das sind völlig willkürlich gewählte K-Werte, es geht nur um das Prinzip. Diese Regel sollte man auch auf Jugendliche mit Elo<2300 beschränken. Vorerst geht es darum der von unten her wirkenden Deflation gegenzusteuern, da könnte man ruhig kräftiger auf die Tube drücken und auch je nach Auswirkung den K-Faktor jährlich neu justieren. Das würde auch eine etwas offensivere Informationspolitik der FIDE erfordern.

Zusammenfassung

Die Elo-Zahlen haben seit 1970 eine rasante Ausbreitung erfahren. Die niedrige Anzahl an Elo-Trägern in den USA und in China zeigt, dass diese Ausbreitung noch nicht abgeschlossen ist.

Durch das Absenken der Mindest-Elo auf 1000 ist ein stetiger Zustrom niedrig bewerteter Spieler in den Rating-Pool entstanden. Diese Spieler dürften schon allein wegen ihrer großen Anzahl einen dämpfenden Effekt auf die Elo-Zahlen der etablierten Spieler in den darüber liegenden Bereichen ausüben. In Tabelle 4 ist die Dynamik dieses Prozesses sichtbar.

Eine Regeländerung, die es Jugendlichen ermöglicht Ihr Elo-Niveau auch in Jugendturnieren zu erhöhen, könnte Druck von den etablierten Spielern nehmen.

 


Walter Wolf lebt in Stuttgart und hat auf seinen Schachreisen, häufig in Indien, viele Eindrücke gesammelt.

Diskutieren

Regeln für Leserkommentare

 
 

Noch kein Benutzer? Registrieren