Die "Elo-Inflation" verstehen

von Bruno Wiesend
09.01.2021 – Es gibt (oder gab) unzweifelhaft eine Inflation der Elozahlen. Aber was ist die Ursache? Manche vermuteten die Absenkung der Eintrittszahl für die Eloauswertung als Ausgangspunkt der Inflation. Bruno Wiesend widerspricht und belegt anhand von statistischen Daten, dass viele starke Nachwuchsspieler letztlich für den Eloanstieg verantwortlich sind.

ChessBase 16 - Megapaket Edition 2021 ChessBase 16 - Megapaket Edition 2021

Dein Schlüssel zu frischen Ideen, präzisen Analysen und zielgenauem Training!
ChessBase ist die persönliche Schach-Datenbank, die weltweit zum Standard geworden ist. Und zwar für alle, die Spaß am Schach haben und auch in Zukunft erfolgreich mitspielen wollen. Das gilt für den Weltmeister ebenso wie für den Vereinsspieler oder den Schachfreund von nebenan.

Mehr...

Die Elo Inflation verstehen

Im Januar 2020 hatten die 50 weltbesten Spieler einen Eloschnitt von 2.735 Punkten. Im Januar 1980 waren es dagegen nur 2.581 Punkte. Diese starke Zunahme wird als Elo-Inflation bezeichnet. Der Gedanke, dass 2.600 Punkte vor 40 Jahren genau soviel wert waren wie 2.750 Punkte heute, ist weit verbreitet. Jeff Sonas hat mit seinem Artikel "Rating inflation - its causes and possible cures" (2009) maßgeblich dazu beigetragen. Er behauptete, dass die frühere Rating Untergrenze (Rating Floor) von 2.200 Punkten die Ursache allen Übels wäre, weil schwächere SpielerInnen, die bei einigen Turnieren zufällig gut abschnitten, ungerechtfertigterweise in die Datenbank gelangten und dann als Punktelieferanten dienten. Dies hätte zu einer systematischen Verzerrung der Elo-Zahlen geführt. Der englischsprachige Wikipedia Artikel "Elo Rating System" bezieht sich auf Sonas und erweckt den Eindruck, dass die Inflation ein Fehler im Elo-System ist. Manche Spitzenspieler teilten diese Ansicht (Nigel Short in ChessBase News, 2009).

Auch die Wissenschaft hat sich mit dem Thema beschäftigt. Howard (1999, 2001) brachte die Tatsache, dass die besten SchachspielerInnen immer jünger werden mit dem Flynn-Effekt in Zusammenhang. Nach Flynn (1987) sind die Ergebnisse von Intelligenz (IQ)-Tests in den Industrieländern bis in die 1990er Jahre ständig angestiegen. Gobet, Campitelli & Waters (2002) widersprachen Howard und machten bessere Trainingsbedingungen und Informationsübermittlung durch Bücher und Schach-Software, ein niedrigeres Start-Alter, ein größeres Turnier-Angebot und höhere Preisgelder dafür verantwortlich. Regan & Haworth (2011) bewerteten die Qualität von Zügen mit Schach-Engines als Benchmark und kamen zu dem Ergebnis, dass es wenig oder keine Elo-Inflation gibt und die SpielerInnen ihre Wertungszahlen verdienen. Strittmatter, Sunde & Zegners (2020) verwendeten eine ähnliche Methode und fanden heraus, dass sich die Spielstärke in den letzten 125 Jahren stark verbessert hat. Der Anstieg war während der 1990er Jahre am steilsten, wofür sie bessere Trainingsmöglichkeiten aufgrund der Digitalisierung verantwortlich machten.

Der Anstieg der Spielstärke in den letzten 125 Jahren ist noch keine Erklärung für die Elo-Inflation. Das Elo-System ist ein relatives und kein absolutes System. Wenn die Spielstärke aller SpielerInnen gleichmäßig ansteigt, dann verändern sich die Ratingzahlen nicht. Ist das Phänomen der Elo-Inflation auf einen Fehler im System zurückzuführen oder sind die SpielerInnen wirklich stärker geworden? Wenn ja, was sind die Ursachen? Zur Beantwortung dieser Fragen verwendete ich die Datenbank des Weltschachverbands FIDE und die Programmiersprache R (R Core Team, 2020). R ist eine frei zugängliche Standard-Software in der Statistik und wird von WissenschaftlerInnen auf der ganzen Welt ständig gepflegt und erweitert. FIDE-Ratinglisten ab Januar 2001 stehen auf der FIDE Webseite zum Download bereit, historische Listen von 1967 bis 2001 auf der OlimpBase Webseite (Bartelski, 2019). Ich habe alle diese Listen bis einschließlich Dezember 2019 zu einer großen Datenbank mit 361.187 SpielerInnen und 26.628.516 Einträgen verschmolzen.

Die SpielerInnen verdienen ihre Ratingzahlen

Abb. 1 A zeigt wie sich die Zahl der SpielerInnen mit einem Rating von 2.200 Elo-Punkten oder höher seit 1975 entwickelt hat. Die dazugehörige Kurve ist S-förmig oder sigmoidal. Sie beginnt und endet mit einem Plateau. Sie wird als logistische Funktion bezeichnet und hat folgende mathematische Formel:

Die Parameter A, B, C und D werden nach der "Methode der kleinsten Quadrate" ermittelt. Die Kurve wird so gelegt, dass die Summe der Abstände der Datenpunkte zu ihr möglichst klein ist. Dazu müssen die Abstände quadriert werden, sonst würden sich positive und negative Abstände gegenseitig aufheben. In Abb. 1 A ist y die Anzahl der SpielerInnen und x das Jahr. A ist der Abstand zwischen Endplateau und Anfangsplateau, B definiert die Steilheit der Kurve zwischen den Plateaus, C ist ihr Mittelpunkt oder Wendepunkt und D ihre Verschiebung entlang der y-Achse; e ist die Eulersche Zahl.

Die logistische Gleichung, die 1838 von dem belgischen Mathematiker Verhulst veröffentlicht wurde, beschreibt Wachstumsprozesse aller Art. Aufgrund der Endlichkeit aller Ressourcen kann es auf dieser Erde kein unbegrenztes Wachstum geben. Es nähert sich immer einem Sättigungswert oder Plateau an. Das Wachstum von Populationen – egal ob Mikroorganismen oder Menschen – erfolgt nach diesem Schema. Ausgefallenere Beispiele sind der Anstieg der Zahl der Universitätsgründungen in Europa und der bekannten chemischen Elemente als Funktionen der Zeit oder die Produktion von Rohstoffen wie Steinkohle, Kupfer und Zink (De Solla Price, 1974).

Das Endplateau einer logistischen Funktion ist häufig das Anfangsplateau einer neuen logistischen Funktion. Auf diese Weise kommt es zur Kettenbildung. De Solla Price hat dieses Phänomen als "Eskalation" bezeichnet (De Solla Price, 1974, S. 35). Ein aktuelles Beispiel ist die COVID-19-Pandemie, in der bereits über eine zweite und dritte Welle gesprochen wird, wobei eine Welle nichts anderes als eine logistische Stufe ist. Die Kurve in Abb. 1 B zeigt, wie sich die Rating-Maxima der 100 besten SpielerInnen von 1975 bis 2019 entwickelt haben. Sie ist durch Eskalation oder Verkettung dreier logistischer Funktionen entstanden, die farblich gekennzeichnet sind. Die FIDE hat den Rating-Floor von ursprünglich 2.200 Punkten auf 2.000 Punkte im Jahr 1992, 1.800 in 2002, 1.600 in 2004, 1.400 in 2006, 1.200 in 2009 und 1.000 in 2012 gesenkt. Aus Abb. 1 ist ersichtlich, dass der Rating Floor – anders als von Sonas (2009) behauptet – nicht den geringsten Einfluss auf die Entwicklung hatte.

Zusammenfassend ist die Zunahme der Elozahlen in den letzten Jahrzehnten als logistischer Wachstumsprozess aufzufassen und nicht auf einen systematischen Fehler im System zurückzuführen. Eine systemimmanente, inflationäre Entwicklung wäre nicht in eine Plateauphase gemündet. Die SpielerInnen verdienen ihre Ratingzahlen. Die alte "Nature versus Nurture" Debatte, ob Vererbung oder Umwelt die Eigenschaften eines Menschen bestimmen, kann hier zugunsten der Umwelt entschieden werden. Das Genom ändert sich nicht innerhalb so kurzer Zeit. Im Folgenden versuche ich diese Umwelteinflüsse näher zu charakterisieren. Inflation wird normalerweise mit steigenden Preisen assoziiert. Sie unterscheidet nicht zwischen Jung und Alt. Bei der Elo-Inflation ist das anders.

Die Elo-Inflation findet in der Kindheit und Jugend statt

Abb. 2 zeigt, wie sich die Spielstärke von aktiven SpielerInnen der Geburtsjahrgänge 1950 bis 1969, die mit 50 Jahren ein Rating von >= 2.200 Punkten aufwiesen, im Alter zwischen 40 und 50 Jahren verändert hat. Die 50 SpielerInnen des Geburtsjahrgangs 1950 hatten im Alter von 40 Jahren ein mittleres Rating von 2.360 Punkten. Mit 50 Jahren waren es 2.353 Punkte. Die 157 SpielerInnen des Jahrgangs 1969 starteten mit 2.357 Punkten und beendeten die 10 Jahres-Periode mit 2.327 Punkten. Die Differenz ist von -7 auf -30 Punkte angewachsen. Die Tendenz im mittleren Erwachsenenalter ist somit deflationär.

Die Elo-Inflation muss folglich bei den Jüngeren gesucht werden. Abb. 3 zeigt die Entwicklung der besten 100 männlichen Spieler verschiedener Geburtsjahrgänge. Jeder kleine, farbige Kreis repräsentiert den Mittelwert von mindestens 50 Spielern. Bei den Jahrgängen 1995-1999 waren 51 der späteren Top 100 - Spieler bereits im Alter von 10 Jahren aktiv. Die Jahrgänge 1955-1959 überschritten die 50er Grenze dagegen erst mit 20 Jahren. Die Spieler der Jahrgänge 1955-59 erreichten ihren Peak oder Spitzenwert von 2.523 Punkten im Alter von 41 Jahren. Der Peak der Geburtskohorte 1985-1989 lag deutlich höher bei 2.635 Punkten und wurde bereits im Alter von 28 Jahren erreicht. Das war aber auch die Obergrenze. Die Jahrgänge 1995-1999 zeigten keine weitere Zunahme der Ratingzahlen mehr. Die sogenannte Elo-Inflation findet somit hauptsächlich in der Kindheit und Jugend statt und ist mit Beendigung der Lernphase und Erreichen des Rating-Peaks beendet.

Das Einstiegs-Alter korreliert mit der späteren Spielstärke

Abb. 4 A zeigt, dass das Alter, in dem die SpielerInnen beginnen, Turniere zu spielen nicht nur mit dem Geburtsjahrgang sondern auch mit der Spielstärke negativ korreliert ist. Je höher die maximale Ratingzahl ist, die sie später erreichen, desto früher erscheinen sie in der Datenbank. Die Absenkung des Rating Floors spielt dabei nur eine Nebenrolle. Die 50 besten männlichen Spieler des Jahrgangs 1980 hatten bei ihrem Eintrittsalter von 15,9 Jahren ein mittleres Rating von 2.242 Punkten. Die 50 Topspieler des Geburtsjahrgangs 1990 starteten im Alter von 12,1 Jahren mit 2.135 Punkten und hatten im gleichen Alter von 15,9 Jahren bereits durchschnittlich 2.359 Punkte auf dem Konto.

Auch das Alter, in dem der Peak erreicht wird, hat kontinuierlich abgenommen (Abb. 4 B). Der Zusammenhang mit der Spielstärke ist hier umgekehrt. Die stärkste Gruppe erreichte ihren Zenit etwas später. Zukünftige SpitzenspielerInnen beginnen natürlich schon einige Jahre bevor sie ihr erstes Turnier spielen, sich intensiv mit Schach zu beschäftigen. Gobet & Ereku (2014) haben die Biografien einiger Super-Großmeister untersucht und ein durchweg einstelliges Start-Alter gefunden.

Lernen erfolgt in Stufen

Die Datenpunkte der Geburtskohorten in Abb. 3 lassen sich bis zum Erreichen des jeweiligen Maximums durch den oberen Teil einer logistischen Kurve anpassen, wie leicht zu erkennen ist. Ist das auch bei individuellen Lernkurven der Fall? Abb. 5 A zeigt die Elo-Entwicklung von Magnus Carlsen. Die Kurve wird durch Verkettung oder additive Kombination von 6 logistischen Funktionen erhalten. Die 1. Ableitung dieser neuen Funktion in Abb. 5 B beschreibt die Veränderung der Elozahl pro Jahr. Sie verdeutlicht, dass Carlsen's schachliche Entwicklung zwischen dem Alter von 10 und 24 Jahren in 6 Stufen mit abnehmender Intensität erfolgte. Sein bisheriges Maximum von 2.882 Punkten erreichte er im Alter von 23,4 Jahren. Die logistische Funktion ähnelt der Verteilungsfunktion der Gaußschen Normalverteilung. Deshalb sieht die Kurve in Abb. 5 B wie eine Aneinanderreihung von 6 Glockenkurven aus. Carlsen ist kein Einzelfall. Die Lernkurven aller Spieler zeigen dieses Phänomen. Anzahl, Höhe und Breite der einzelnen Stufen sind individuell verschieden. Aber das Prinzip des Lernens als eskalierendes, logistisches Wachstum gilt für GroßmeisterInnen und DurchschnittsspielerInnen gleichermaßen. Schon Arpad E. Elo, der Erfinder des Elosystems, hat einen stufenförmigen Verlauf des Lernens postuliert und ein plötzliches starkes Ansteigen der Spielstärke bei jungen SpielerInnen als Quantensprung ("quantum jump") bezeichnet (Elo, 2008, S. 105).

In Lehrbüchern der kognitiven Psychologie (Anderson, 2013, S. 127) findet man dagegen fälschlicherweise, dass Lernen einem Potenzgesetz folgt ("The power law of practice"). Diese Einschätzung geht maßgeblich auf Newell & Rosenbloom (1981) zurück. Durch Übung wird die Ausführungszeit von Tätigkeiten verkürzt. Wenn man auf doppelt-logarithmischem Papier die Ausführungszeit gegen die Anzahl der Versuche auftrug, erhielt man annähernd Geraden, weil Potenzfunktionen durch beidseitiges Logarithmieren in lineare Funktionen übergeführt werden. Das wurde allgemein als Beweis für die Gültigkeit des Potenzgesetzes akzeptiert. Das bekannteste Beispiel stammt von Crossman (1959), der herausfand, dass ArbeiterInnen in einer Zigarrenfabrik immer weniger Zeit brauchten, um eine Zigarre herzustellen, bis irgendwann eine untere Grenze erreicht war. Newell & Rosenbloom (1981) schlossen die logistische Funktion von vornherein von ihren Überlegungen aus, weil sie ansteigt und deshalb eine Verkürzung der Ausführungszeiten ihrer Ansicht nach nicht darstellbar war. Es gibt natürlich auch negatives logistisches Wachstum. Wenn diese Autoren der logistischen Formel ein Minuszeichen vorangestellt hätten, wäre die Geschichte vielleicht anders verlaufen. Gaschler, Progscha, Smallbone, Ram & Bilalić (2014) und Howard (2014) versuchten erfolglos, Lernkurven von SchachspielerInnen mithilfe einer Potenzfunktion anzupassen.

Die Talentiertesten profitieren am meisten von der Entwicklung

Die Kurven in Abb. 6 sind die Wahrscheinlichkeits-Dichtefunktionen der SpielerInnen unterschiedlicher Ratingklassen der Geburtsjahrgänge 1930 bis 2010. Die rote Kurve gehört den 120 SpielerInnen, die irgendwann in ihrer Karriere ein Rating von 2.700 Punkten oder höher erreicht haben. Darunter ist als einzige Frau Judit Polgár. Wenn Statistiker von Wahrscheinlichkeit sprechen, dann meinen sie die Fläche unter einer Kurve. Die Fläche links von der senkrechten gestrichelten Trennlinie bei Jahrgang 1975, beträgt 21,7 % der Gesamtfläche. Das bedeutet, dass 26 der 2.700+ SpielerInnen vor 1975 geboren sind, während 78,3 % oder 94 im Jahr 1975 oder später geboren sind. Je höher die Spielstärke ist, desto höher ist der prozentuale Anteil der nach 1975 Geborenen. Die drei schwächeren Gruppen zeigen an der Stelle, wo das Hauptmaximum der beiden stärksten Gruppen liegt – etwa bei Jahrgang 1986 – nur einen Nebenpeak.

Abb. 7 zeigt, wie sich die mittlere Spielstärke der besten 50, 101-150 und 401-450 SpielerInnen der Geburtsjahrgänge 1960 bis 1990 entwickelt hat. Die Schere zwischen den Top 50 und den schwächeren Gruppen klafft immer weiter auseinander. Beim Jahrgang 1960 ist der Unterschied zwischen den besten 50 und denen der Rangliste 401-450 etwa 250 Punkte, beim Jahrgang 1990 sind es schon fast 400 Punkte. Der stärkste Anstieg beginnt interessanterweise beim Jahrgang 1983 und ist bei der Top 50 - Gruppe viel stärker ausgeprägt als bei den schwächeren Gruppen. Das Absinken der Kurven der schwächeren Gruppen hängt damit zusammen, dass später geborene SpielerInnen immer weniger Zeit haben, ihr Ratingmaximum zu erreichen, weil die Datenbank nur bis einschließlich 2019 reicht. Dieser Effekt ist in der Top 50 - Gruppe nicht erkennbar.

Wenn sich die schachlichen Umweltbedingungen verbessern, dann sollte man eigentlich erwarten, dass alle gleichmäßig davon profitieren. Das ist hier nicht der Fall. Es hat eine Entwicklung stattgefunden, die den Stärksten am meisten zugutegekommen ist.

Diskussion

Die Argumentation von Sonas (2009), dass der Rating Floor für die Elo-Inflation verantwortlich ist, ist nicht stichhaltig. Genauso wenig sollte man glauben, dass Siegbert Tarrasch – der im Hauptberuf Arzt war und Schach nie professionell betrieben hat – eine Ratingzahl von 2.824 nach heutigem Maßstab hatte. Die historischen Chessmetrics Ratings von Sonas ignorieren, dass sich die Spielstärke in den letzten 125 Jahren nicht nur in der Spitze sondern vor allem auch in der Breite stark verbessert hat. Deshalb sind 15 der nach Chessmetrics 50 besten SpielerInnen vor 1900 geboren und hatten ein durchschnittliches 1-Jahres Rating von 2.799 Punkten. Das lineare Erwartungsmodel ("linear expectancy model") – das dem Ratingsystem von Sonas zugrundeliegt und von dem er behauptet, dass er es selbst entwickelt hat – hat Elo schon lange vorher erwähnt und als Verzerrung ("bias") kritisiert (Elo, 2008, S. 28, zuerst veröffentlicht 1978).

Die individuelle Entwicklung von SchachspielerInnen erfolgt in Stufen oder Wellen, wie am Beispiel von Magnus Carlsen gezeigt wird (Abb. 5). Starke Anstiege wechseln sich mit scheinbaren Ruhephasen ab, in denen jedoch neue Erfahrungen gesammelt und neue Kräfte für den nächsten Sprung akkumuliert werden. Wenn das schwächste Glied der Kette beseitigt ist, kommt es zu einer schlagartigen Entladung der aufgestauten Energie und zu einem plötzlichen Anstieg der Spielstärke, was Elo als Quantensprung bezeichnet hat. Die Plateauphasen in den Abb. 1 und 5 sind der Beweis dafür, dass das Elo-System nicht inflationär ist. Magnus Carlsen hat die höchste jemals erreichte Wertung und ist der stärkste Schachspieler aller Zeiten. Das Potenzgesetz des Lernens ist einer der langlebigsten Irrtümer in der Geschichte der kognitiven Psychologie. Potenzfunktionen können keine Stufen darstellen. Lernen ist eskalierendes logistisches Wachstum, um das Wort von De Solla Price (1974) zu gebrauchen.

Zukünftige WeltklassespielerInnen beginnen im einstelligen Alter Schach zu spielen. Die kritische Phase vor dem 10. Lebensjahr prägt die spätere Entwicklung. Wer dieses Zeitfenster verpasst, vergibt die Chance, ihr oder sein natürliches Potential voll auszuschöpfen. Je später der Einstieg erfolgt, desto geringer ist der Erfolg. Das alte Sprichwort "Was Hänschen nicht lernt, lernt Hans nimmermehr" bringt es auf den Punkt. Schach ist nicht zuletzt dank Bobby Fischer immer populärer geworden. Die Menschen haben mehr Freizeit zur Verfügung. Das hat dazu geführt, dass Erwachsene mehr Zeit für Schach aufwenden und Kinder dazu animieren, es ihnen gleichzutun. Die Talentiertesten haben in den letzten Jahrzehnten immer früher und intensiver mit Schach begonnen (Abb. 4 A). Das ist einer der Hauptgründe für die sogenannte Elo-Inflation. Eine Verbreiterung des Talent-Pools als Ursache ist dagegen unwahrscheinlich. Es ist davon auszugehen, dass die Talentiertesten in den letzten Jahrzehnten schon immer vollzählig an Bord waren und Spitzentalente nicht einfach übersehen wurden.

Die orange Kurve in Abb. 7 zeigt einige kleinere Wellen aber auch einen Quantensprung im Elo'schen Sinn, der mit dem Geburtsjahrgang 1983 beginnt und für die letzte Stufe in Abb. 1 B (oranger Teil der Kurve) verantwortlich ist. Dieser abrupte Anstieg ist nicht alleine mit der kontinuierlichen Absenkung des Start-Alters erklärbar. Es besteht ein zeitlicher Zusammenhang mit der Digitalisierung im Schach, die eng mit dem Namen ChessBase verknüpft ist. Matthias Wüllenweber startete sein Projekt Mitte der 1980er Jahre. ChessBase hat das Schachtraining revolutioniert. Die Geburtsjahrgänge ab 1983 konnten daraus als Erste einen signifikanten Nutzen ziehen. SchachspielerInnen aller Leistungsklassen haben davon profitiert, aber die Talentiertesten am meisten. Diese Asymmetrie (Abb. 6 und 7), die offenbar für alle umweltbedingten Leistungssprünge im Schach gilt, ist der Schlüssel zum Verständnis der Elo-Inflation.

Die letzte Plateau-Phase hat ab etwa 2012 eingesetzt (Abb. 1 B). Es könnte sein, dass damit die natürliche menschliche Leistungsgrenze bereits ausgelotet ist. Die Umweltbedingungen lassen sich nicht unbegrenzt verbessern. Es ist kaum vorstellbar, dass eine weitere Absenkung des Start-Alters möglich ist und einen zusätzlichen Effekt brächte. Vielleicht gelingt der Forschung eines Tages im mentalen Bereich, was ihr im physischen Bereich mit Anabolika und Wachstumshormonen gelungen ist. Ob das wünschenswert ist, ist eine andere Frage.

 

Abbildungen:

Abbildung 1. Die Elo-Inflation in der FIDE-Datenbank. Sowohl die Anzahl der SpielerInnen mit Elo 2.200 oder höher (A) als auch das Rating der 100 besten SpielerInnen (B) ist stufenförmig gewachsen und lässt sich mit der logistischen Funktion beschreiben. In Abb. B sind drei logistische Funktionen miteinander verkettet.

Abbildung 2. Elo-Deflation im mittleren Erwachsenen-Alter. Je später geboren die SpielerInnen sind, desto größer ist ihr Elo-Verlust zwischen 40 und 50 Lebensjahren. Die Kurvenanpassung in den Abb. 2, 4 und 7 erfolgte mit einer Methode, die als "generalized additive modeling" (GAM) bekannt ist. Hierzu kam das R-Paket "itsadug" (van Rij, 2020) zum Einsatz.

Abbildung 3. Elo-Inflation in jungen Jahren. Je später geboren die SpielerInnen sind, desto höher ist ihr Spitzenwert oder Peak. Die Obergrenze ist bei den Jahrgängen 1985-89 erreicht. Die Jahrgänge 1995-99 zeigen keine weitere Steigerung der Ratingzahlen mehr. Die Kurven sind hier nicht angepasst, sondern die Punkte durch gerade Linien verbunden.

Abbildung 4. Abnahme des Einstiegs-Alters und Peak-Alters. Spätere Geburtsjahrgänge beginnen immer früher Turniere zu spielen und erreichen ihr Rating-Maximum in jüngeren Jahren. Es besteht ein Zusammenhang mit der Spielstärke. Beim Alter in dem der Peak erreicht wird, ist die Reihenfolge umgekehrt.

Abbildung 5. Lernen ist eskalierendes logistisches Wachstum. Die Elo-Entwicklung von Magnus Carlsen lässt sich zwischen dem Alter von 10 und 24 Jahren durch additive Kombination von sechs logistischen Funktionen darstellen (A). Die 1. Ableitung dieser neuen Funktion ist in Abb. B zu sehen. Das Geburtsdatum von Carlsen ist bekannt. Deshalb konnte das Alter in Dezimalzahlen berechnet werden, wobei wegen der Schaltjahre ein Jahr mit 365,25 Tagen angesetzt wurde.

Abbildung 6. Die talentiertesten SpielerInnen profitieren am meisten (I). Wahrscheinlichkeitsdichte-Kurven der Geburtsjahrgänge 1930-2010. Der prozentuale Anteil der SpielerInnen, die nach 1975 geboren sind, nimmt mit steigender Ratingzahl zu.

Abbildung 7. Die talentiertesten SpielerInnen profitieren am meisten (II). Die Schere zwischen den Top 50 und den Top 401-450 SpielerInnen klafft immer weiter auseinander. Der stärkste Wachstumsschub beginnt mit dem Jahrgang 1983.

 

 

Literaturstellen:

Anderson, J. R. (2013), Kognitive Psychologie, Springer VS, Berlin Heidelberg. Zuerst veröffentlicht von Worth Publishers, New York, 2010.

Bartelski, W. (2020), OlimpBase, Elo lists 1971-2001

Crossman, E. R. F. W. (1959). A Theory of the Acquisition of Speed-Skill. Ergonomics, 2:2, 153-166.

De Solla Price, D. J. (1974). Little Science, Big Science, Suhrkamp, Frankfurt a. Main. Zuerst veröffentlicht von Columbia University Press, New York (1963)

Elo, A. E. (2008). The Rating of Chessplayers, Past & Present. Bronx, NY: Ishi Press International. (zuerst veröffentlicht 1978)

Flynn, J. R. (1987). Massive IQ gains in 14 nations: what IQ tests really measure. Psychological Bulletin, 101, 171–191.

Gaschler, R., Progscha, J., Smallbone, K., Ram, N., Bilalić, M. (2014). Playing off the curve - testing quantitative predictions of skill acquisition theories in development of chess performance. Front. Psychol., 5: 923.

Gobet, F., & Ereku, M. H. (2014). Checkmate to deliberate practice: the case of Magnus Carlsen. Front. Psychol. 5: 878

Gobet, F., Campitelli, G., Waters, A.J., (1999). Rise of human intelligence Comments on Howard. Intelligence 30, 303-311.

Howard, R. W. (1999). Preliminary real-world evidence that average human intelligence really is rising. Intelligence, 27, 235-250.

Howard, R. W. (2001). Searching the real world for signs of rising population intelligence. Personality and Individual Differences 30, 1039-1058.

Howard, R. W. (2014). Learning curves in highly skilled chess players: a test of the generality of the power law of practice. Acta Psychol. 151, 16–23.

Newell, A., & Rosenbloom, P. S. (1981). Mechanisms of skill acquisition and the law of practice. In 1. R Anderson (Ed.), Cognitive skills and their acquisition (pp. I-55). Hillsdale, NJ: Erlbaum.

R Core Team. (2020). R: A language and environment for statistical computing. Vienna, Austria: R Foundation for Statistical Computing. URL https://www.R-project.org/.

Regan, K.W., McC. Haworth, G., (2011). Intrinsic Chess Ratings. Conference: Proceedings of the Twenty-Fifth AAAI Conference on Artificial Intelligence, San Francisco, California, USA, August 7-11, 2011.

Sonas, J., 2009. Rating inflation - its causes and possible cures, Chessbase News

Chess News (2009). Nigel Short on being number one in Britain again.

Strittmatter, A., Sunde, U., Zegners, D., (2020). Life cycle patterns of cognitive performance over the long run. Proc Natl Acad Sci U S A . 2020 Nov 3;117(44):27255-27261

van Rij, J., Wieling M, Baayen R, van Rijn H (2020). “itsadug: Interpreting Time Series and Autocorrelated Data Using GAMMs.” R package version 2.4.

 

 


Jahrgang 1955 aus Münchner. Bruno Wiesend hat in pharmazeutischer Chemie promoviert und kam 1980 anlässlich des Kandidatenfinales Hübner gegen Kortschnoi zum Schach. Beste DWZ: 2097 in 2005. Derzeit als Spieler nicht mehr aktiv, ist er dem Schach aber dennoch treu geblieben und befasst sich als Zahlenfan gerne mit mit statistischen Auswertungen und Kurvenanpassung.

Diskutieren

Regeln für Leserkommentare

 
 

Noch kein Benutzer? Registrieren

gambler1 gambler1 14.01.2021 03:54
@Pemoe6 . Die hohe "Deflation" im mittleren Spielersegment (und im Alter ab ca. 50) liegt meines Erachtens weniger am Alter, aber natürlich auch), als vielmehr in meist vermindertem intensivem Wettkampf-Spiel in diesen Jahren. Eine gewisse Buße an die Gemütlichkeit des Lebens?
Vor allem liegt es aber auch in den vielen FIDE Berechnungs-Änderungen.
Die Elo-Verluste können einerseits an offenbar stärker gewordenen Gegnern manifestiert werden (der Technikschub der Jungen), aber auch, dass die Elozahlen der "Verlierer" früher teils doch überhöht waren, gemessen an nunmehrigen Berechnungs-und Einstiegswerten.
Das liegt an den geänderten FIDE Einstiegswerten von früher: Von 2200 bis nun "runter" auf -glaube -1600.
"Früher", also in den 80er, hatte man als FIDE Eloist gar keine schlechteren gewerteten Gegner als 2200er, also gab es auch weniger hohe Eloverluste.
Andererseits waren viele Siege damals "elomäßig nichts wert", wenn der Gegner noch keine FIDE Zahl hatte, wurde auch nichts gewertet.
Kurzum: Der heutigen Jugend, den Lerneifrigen und somit weltweit diesen Spielern kommt die Technik der Analyse, der ultraschnellen Berechnung und Datenbanken sehr entgegen und ist eine weltweite Öffnung des Wissens und der Demokratisierung des Spiels (Kindermann) evident.
Ein mathematischer Spezialist dafür wäre sicherlich u.a. Dozent (oder Uni-Prof.) IM Dr. Arne Dür, Uni Innsbruck.
Pemoe6 Pemoe6 14.01.2021 01:52
@gambler1: Im Artikel steht:
"Aus Abb. 1 ist ersichtlich, dass der Rating Floor – anders als von Sonas (2009) behauptet – nicht den geringsten Einfluss auf die Entwicklung hatte."
Sie behaupten genau das Gegenteil, gehen aber nirgendwo auf die Nachweisführung des Autors ein. Wenn also die geänderte Einstiegsberechtigung doch irgendeine Bedeutung hat, wie erklärt sich dann Abb. 1?
gambler1 gambler1 14.01.2021 11:15
Wie kann man seine eigene ELO "inflationieren". Also erhöhen? Das Wort bedeutet eigentlich exakt, dass die Spielstärke geich bleibt und nur die Zahl steigt)). Also ist der Terminus im Artikel mal zu hinterfragen.
Egozentrisch betrachtet weiß man es eh: "Man" oder frau benötigt dafür: die "richtigen" Gegner (nicht gar zu stark,sodass man doch eher verliert, aber nicht zu schwach, sodass man keien Punkte erhält: Am besten ältere noch überbewertete Gegner, die wenig spielen), 2. die "richtigen" Turniere (wo eben sich diese Gegner befinden) 3. Nerven stählen und Technik verbessern weiß eh jeder, aber leichter gesagt als getan...Dennoch: So betreiben sie mal möglichst erfolgreiche "Elopflege".
gambler1 gambler1 14.01.2021 10:56
Die FIDE Rating (vulgo ELo) Infaltion oder auch Degression liegt vor allem an den oftmalig geänderten Einstiegsberechnungen der FIDE. In den 80ern kam man erst ab 2200 in die Liste. Dafür dasnn oft mit Zahl "über" der normalen Spielstärke. In den letzten Jharen erfolgte durhc die strake Absenkung (auch bei der Jugend) eine Degression.Viele gute Junge aus der 3. Welt steigen mit Zaheln zwischen 1600-1800 ein..Und nehemn dann arrivierten Spielern wiederum Elo ab..Das führte zur Degression bei dem Mittelbau der früheren 2200-2300er, die fats alle "verloren". Dazu kommt die altersbedingte Schwächung der ELO-Zahlen. Mit Technik lässt sich heute einiges korrigieren. Aber wenn ein ELO Pott zu niedrig ist (bei minimalem Zufluss von aussen) , oder sehr hoch, dann bleibt der Pott niedrig (oder lange hoch).That´s it.
Pemoe6 Pemoe6 13.01.2021 06:24
@CrimsonSeahawk: Dieser Einwand geht am Inhalt des Artikels vorbei, denn dort wurde ja gerade nachgewiesen (oder versucht, nachzuweisen), dass diese historischen ELO-Zahlen kompletter Blödsinn sind.
michanizm michanizm 12.01.2021 08:07
Tolle Analyse.
Nur mir gefällt in dem Zusammenhang das Wort "Inflation" überhaupt nicht.
Der Begriff kommt ja aus der Wirtschaft und bedeutet eine Erhöhung des Preisniveaus und bei gleichzeitigem Kaufkraftrückgang. Inflation steht also für Entwertung.


Ich kann aber bei den Elo-Zahlen keine Entwertung sehen.
Nur mehr Spieler, die eine hohe Elo erreichen.
Kasparov hielt lange den Elo-Rekord von 2856. Nur Carlsen konnte bisher die Elo knacken und zwar weil er der stärkere Spieler ist. Ansonsten bleibt diese Elo wie eine Festung in der Schachwelt. Nur die wenigsten der aktuellen Schachspieler schaffen es überhaupt mal kurzfristig über die 2800, geschweige denn sich über 2800 zu etablieren.
Das spricht ganz klar gegen eine Inflation. Die Spitzenwerte inflationieren also nicht überhaupt nicht.
flachspieler flachspieler 11.01.2021 12:31
Bewertung von Spielstärken in Zweipersonen-
Nullsummen-Spielen durch einfache Zahlen ist
eine hochkomplizierte Sache.

Insbesondere gibt es schon ganz einfache
Szenarien, wo es KEINE in sich konsistenten
Wertungszahlen für nur drei Spieler gibt.

Konkreter: Für das einfache Spiel "Double Step Race
der Länge 3" habe ich drei verschieden starke Computer-
programme A, B, C betrachtet, die sich nur in ihrer
Doppelzughäufigkeit unterscheiden.

A war das schwächste programm, B mittelstark, und C
am stärksten. Theoretisch habe ich aus den paarungen
A-vs-B und B-vs-C Ratingzahlen rA, rB, rC berechnet,
wobei ich die Stärke von B willkürlich festgesetzt habe.

Aus diesen Ratingzahlen habe ich die Erfolgsquote von A
gegen C hergeleitet. Aber für die paarung A-vs-C ergab
sich eine etwas andere Erfolgsquote. Der Unterschied war
nicht gross, aber er war da.

Wer gerne grosse Namen benutzt, mag dieses eine
Art Nichtexistenz-Theorem für in sich konsistente
Elo-Systeme nennen. Dass Elo-Zahlen praktisch
ziemlich gut funktionieren, steht auf einem anderen
Blatt.

Ingo Althöfer.
JoelH_DE JoelH_DE 11.01.2021 08:39
Anstatt nach oben würde ich gerne auch einen solchen Blick nach unten werfen wollen. Die ELO-Zuwächse müssen ja auch irgendwo abgeschöpft werden.
Wie sieht es denn mit den "Verlierern" aus, wo kommen die denn her? Denn letztlich ist es doch so, durch die gesunkene Schranke wurden dem System neue Punkte zugeführt die sich dann verteilt haben, zumeist von unten nach oben. Denn letztlich ist es so wie beim Geld, es wandert immer nach oben.

Wie sieht es denn über alles aus? Wie Viele ELO-Punkte sind aktuell insgesamt im Umlauf und wie sind die verteilt? Und wie war das vor 20-30-40 Jahren?

Irgendwie sehe ich das hier zu wenig berücksichtigt.

Des Weiteren, die Jungen Spieler profitieren einfach sehr von den gesenkten Einstiegswerten. Zwei Beispiele aus meiner Praxis. Ich musste in Open sowohl gegen den jungen Alexander Donchenko als auch Dennis Wagner spielen. Damals war ich auf dem Papier noch der Favorit, die Jungs haben mich aber einfach an die Wand gespielt, weil ihre Zahl damals schlicht nicht ihrem Stärkezuwachs nach kam. Sie haben also einfach meine Werte abgeschöpft völlig am mathematischen System vorbei, da dieses einfach zu langsam reagiert.
TobiasHabermehl TobiasHabermehl 10.01.2021 11:19
Intuitiv fallen mir 2 Erklärungen ein:
1. Je mehr Spieler im System erfaßt sind, desto höher werden in der Spitze die Zahlen.
2. Wenn die einzelnen ELO-Klassen unter sich bleiben und z.B. die Open typische Durchmischung fehlt, bringt das oben eine breitere und höhere Spitze im Rating.
gamander gamander 10.01.2021 12:43
Der Artikel erklärt nicht, wie es in einem relativen System wie Elo überhaupt dazu kommen kann, dass das Rating der Top-Spieler so stark zunimmt. Habe ich da etwas überlesen? Liegt es daran, dass heute viel mehr Spieler in der Eloliste geführt werden als vor 20 Jahren? Oder kann diese Inflation hinreichend dadurch erklärt werden, dass der Abstand zwischen Spitze und Durchschnitt stark zugenommen hat?
DoktorM DoktorM 09.01.2021 08:11
Mathematisch einfach kann man da nichts sagen. Vielleicht liegt es an vielen jungen Spielern, die für ihre Spielstärke eine zu niedrige Elozahl haben. Diese jungen Spieler sorgen für Eloverluste unter anderen elostärkeren Spielern, erhöhen dadurch ihre Elozahl, während die anderen Spieler ihre Verluste mittelfristig wieder ausgleichen.

Die Dynamik im Elosystem ist sicher nicht durch einige Kurven aus speziellen Bereichen zu erklären. Manchmal gibt es gar keine mathematischen Beschreibungen für solche Dynamiken. Dann bleibt die Simulation.
CrimsonSeahawk CrimsonSeahawk 09.01.2021 06:52
Nur ein kleiner Krennwurzn-Einwand: fast keiner der heutigen Top50 Spieler würde ein Spiel wie das aus der 6. Runde so gewinnen ;-)
KWRegan KWRegan 09.01.2021 05:56
Der Artikel erwähnt Regan-Haworth (2011), aber vor allem soll er Regan-Macieja-Haworth (auch 2011, https://link.springer.com/chapter/10.1007%2F978-3-642-31866-5_20#page-1) folgen: dieser Bericht spricht die Inflation direkt an. Die Abbildung 1 (Anzahl SpielerInnen >= 2200) bis auf 2011 kann man auch dabei finden (sie kam vom GM Macieja), und zwar noch in meinem Blog-Artikel https://rjlipton.wordpress.com/2012/03/30/when-is-a-law-natural/ Heute in 2021 muss Maciejas Abbildung als <<wahre Prädiktion>> gelten.
Jens Tolkmitt Jens Tolkmitt 09.01.2021 05:35
Ich denke, es wird hier ein wenig eindimensional nur auf das Eintrittsalter der Spieler und ihre damit resultierende Entwicklung geschaut. Die jungen Spieler mit den höhreren Elozahlen sind ein Spiegelbild der Inflation der ELO Zahlen, aber nicht deren Ursache.
Wie im Artikel beschrieben, vermuten manche, dass die Absenkung der unteren Grenze zu einer Erhöhung der Zahlen führt. Aber genau das Gegenteil ist der Fall, denn eine untere Grenze führt eigentlich zwangsweise zu inflationären Tendenzen. Das kann man mathematisch relativ einfach belegen. Zudem spielt der Auswertezeitraum eine sehr große Rolle und mit Verringerung dieses Zeitraumes auf jetzt einen Monat wirkt man der Inflation recht deutlich entgegen (ideal wäre die Neuberechnung nach jeder Partie).
Ein anderes Problem des Elo-Systems ist als das "Problem der tausend Partien" bekannt. Um so mehr Spieler gegeneinander spielen (in der Weltspitze ist es ja eher so, dass einige wenige immer mehr nur gegeneinander spielen), um so mehr kommt das zum Tragen (wobei bei der innerhalb eines Auswertezeitraumes spielbaren Partien insgesamt nicht so stark zum Tragen kommt). Klar ist aber, dass wesentlich mehr Partien gespielt werden und in Verbindung mit der unteren Grenze des Systems eben ein Anwachsen zu beobachten ist.
Was die Spieler jüngerer Jahrgänge angeht - sie werden in das System "hinein geboren", sind bestenfalls Nutznießer. Sie tragen aber keine Schuld an der Sache, wie auch. Und man sollte auch nicht vergessen, dass die Breite heute durch verbesserte Trainings- und Spielmöglichkeiten schlicht auch besser spielt, insofern sind dann auch die ELO Zahlen höher.
rollschu rollschu 09.01.2021 04:43
@flachspieler: die Validierung der Theorie an Go halte ich für eine gute Idee. Musste auch an Ihre 3-Hirn Experimente denken. Wie war das noch: +200Elo Punkte auf die Elo-Zahl des stärksten "Hirns"? Diese Konstante hängt vermutlich stark vom menschlichen Bediener ab. Überhaupt ein schönes Beispiel für Mensch-Maschine Zusammenarbeit und aktueller denn je. Ich frage mich auch wie das Plateau der letzten Jahre zu interpretieren ist. Ist das klassische Schach ausgereizt? Laut Carlsen ja wohl schon und der AlphaZero-Leela Effekt scheint nur von schwacher Relevanz zu sein. Deshalb sein Vorschlag bei langen Partien auf die 960-Variante zu wechseln. Ich halte das für einen guten Vorschlag.
Krennwurzn Krennwurzn 09.01.2021 04:14
Nur ein kleiner Fischer-Einwand: fast jeder heutige Top50 Spieler würde das Endspiel aus der 1. Runde Remis halten ;-)
flachspieler flachspieler 09.01.2021 03:57
Eine Übersetzung des Artikels in Englische wäre sicherlich toll. Interessant dürfte auch ein Querbezug zum Go-Spiel werden. Dort gibt es auch seit deutlich mehr als 10 Jahren Elo-Zahlen - sehr starke allgemein verfügbare Computer-Programme aber erst seit 2017 (starke seit etwa 2010).
Vielleicht wird im Go-Spiel eine ähnliche Elo-Entwicklung wie beim Schach mit Zeitverzögerung passieren.

@TigerinRente: Hallo. Ja, es ist fast 35 Jahre her. In der damaligen Zeit hat Matthias Löwe ja seinen ersten Krimi angesiedelt: "Tod an der Sparrenburg" - auch mit Schach- und Mathe-Bezug.
CrimsonSeahawk CrimsonSeahawk 09.01.2021 02:06
Die höchste bisher erreichte Elozahl eines Menschen ist die historische Elozahl von 2895 ! Bobby Fischers aus dem Jahre 1971.
Dies wäre inflationsbedingt die Spielstärke Fischers im heutigen Spitzenschach.

Mit 2895 also fast 3000 Elo sollte Bobby Fischer auch heute noch, fast 50 Jahre nach dieser Messung, ein Chance wenn nicht leichtes Spiel gegen einen Magnus Carlsen haben.
Krennwurzn Krennwurzn 09.01.2021 01:59
Schöner Artikel - ich sehe es wie @Flachspieler, würde es aber breiter anlegen. Durch die Möglichkeiten des Internets wurde der Zugang zu Schachwissen einfacher und breiter. Informationen, die vorher nur in wenigen elitären Einrichtungen vorhanden waren, sind nun für alle zugreifbar. Außerdem sind mit den Engines gute Trainingspartner jederzeit vorhanden. Usw. - ChessBase hat natürlich auch dabei einen wesentlichen Part beigetragen!

Die Vergleichsfragen sind unlösbar: Hätte Jesse Owens die Zeiten von Usain Bolt laufen können ...
rollschu rollschu 09.01.2021 01:29
Toller Artikel der das Phänomen endlich schlüssig erklärt! Ich hatte immer schon die Vermutung, dass es in der Hauptsache keine Inflation ist, sondern eine reale Steigerung der Spielstärke. Also hätte ein 1972 Bobby Fischer keine Chance gegen einen 2020 Magnus Carlsen. Die Frage, wie Fischer heute spielen würde, wenn er erst 1990 geboren worden wäre, ist dagegen ohne praktische Relevanz.
Wirklich auch interessant zu sehen, welchen positiven Effekt elektronische Hilfsmittel bei der Verbesserung der kognitiven Leistungsfähigkeit spielen können. Ich bin zuversichtlich, dass man das in (ferner) Zukunft auch von der Vernetzung der Menschheit durch das Internet wird sagen können.
Bitte den Artikel unbedingt übersetzten und auf Englisch veröffentlichen. Den Begriff "Inflation" würde ich im Artikel immer nur in Anführungszeichen setzen.
Bernhard Sax Bernhard Sax 09.01.2021 12:05
Man kann es folgendermaßen sehen: "So wie sich beim Skispringen die Weiten aufgrund besseren Materials entwickelt haben, so haben sich beim Schach die Elozahlen aufgrund besserer technischer Möglichkeiten entwickelt"!

Leider kann man keinen Vergleich ansetzen, wie eine Wettkampf zwischen Bobby Fischer und Magnus Carlsen auf Ihren jeweiligen Elo Zenit ausgegangen währe! Ob nicht ein Bobby Fischer mit Elo 2785 einen Magnus Carlsen mit Elo 2882 dominiert hätte!
Steinschuld Steinschuld 09.01.2021 11:09
Schöner Artikel.
tigerinrente tigerinrente 09.01.2021 10:29
Ja, natürlich tragen die elektronischen Hilfsmittel dazu bei, sein Spiel zu verbessern. Z.B. einfach dadurch, dass der Anteil monotoner Tätigkeit beim Erlernen von schachlichen Fähigkeiten drastisch reduziert witd. Früher hatte ich drei Bücher für meine Liebslingseröffnung. Nach jeder angeblichen Neuerung (auf Vereinsspielerniveau!) habe ich Stunden gebraucht, um meine Bücher danach zu studieren. Das erledigt heute CB mit einem Klick.

Werner Brakemann
P.S. Schönen Gruß Ingo, lange nichts von dir gehört
flachspieler flachspieler 09.01.2021 09:47
Sehr interessanter Artikel, danke dafür.

Wenn man sich das allererste Diagramm und auch einige andere anschaut, bietet sich eine Erklärung an: Der Anstieg des Durchschnitts der Top-100-Spieler begann 1986/87. Seit 2010 etwa stagniert dieser Wert. Meine Vermutung: Einen wesentlichen Mitanteil tragen die elekronischen Hilfsmittel und Datenbanken, vor allem auch die der Firma ChessBase (gegründet 1986 !!!). Nach 2010 kam irgendwann "Let's Check" als Neuerung, aber das scheint kaum noch zu einer Steigerung in der Spitze geführt zu haben.

Ingo Althöfer.
1