"Mastering Games without human knowledge"

von Conrad Schormann
26.02.2018 – Im letzten Dezember sorgte die Google-Tochter Deep Mind mit ihrem "Machine Learning"-Projekt AlphaZero für Aufsehen. Nach kurzer Selbstlernphase war das Programm imstande das Spitzenprogramm Stockfish zu schlagen. Viele haben sich das Ergebnis angeschaut - Conrad Schormann auch die Partien. (Foto: Videocap "The Artificial Intelligence Channel")

Komodo 12 Komodo 12

Komodo gibt Gas! Die neue Version des mehrfachen Weltmeisterprogramms spielt nicht nur stärker als jemals zuvor. Mit ihrer neuen "Monte-Carlo" Version - basierend auf KI-Techniken - spielt sie auch deutlich aggressiver.

Mehr...

AlphaZero vs. Stockfish: Partieanalyse

Wie kann es sein, dass AlphaZero mit Weiß Stockfish deklassiert (37,5:12,5), mit Schwarz aber nur knapp gewinnt (26,5:23,5)? Das ist eine der offenen Fragen nach dem AlphaZero-Stockfish-Match. Wer einwendet, dass ja Weiß den Anzugsvorteil auf seiner Seite hat, der hat natürlich Recht, aber die Deutlichkeit des Weiß-Ergebnisses geht weit über den Anzugsvorteil hinaus. Andere Faktoren müssen eine Rolle gespielt haben.
 
Niemand bezweifelt, dass AlphaZero das beste jemals auf diesem Planeten gespielte Schach demonstriert hat. Aber wie gut war das wirklich, wie viel besser als Top-Engines ist AlphaZero? Diese Frage bleibt offen, weil die Google-Tochter und AlphaZero-Mutter DeepMind sich beim Organisieren eines regulären Wettkampfs weniger Mühe gegeben hat als bei der Entwicklung maschinellen Lernens.
 
Die Entscheidung, Stockfish ohne Eröffnungsbuch spielen zu lassen, hat nicht nur seiner Performance geschadet, sie führte zu einer limitierten Auswahl von Aufstellungen und Strukturen, mit denen sich Stockfish AlphaZero entgegenstemmte. Und ausgerechnet diese Auswahl entpuppte sich als wenig geeignet, mit Schwarz den Ball flach zu halten, solide zu stehen und mit einem halben Punkt davonzukommen. Wiederholt begab sich der ab Zug 1 rechnende Stockfish in französische und damenindische Gefilde und wurde ebendort wiederholt Opfer der positionellen Dominanz der Google-Maschine, die sich in den entstehenden Strukturen deutlich besser zurechtfand – und eben mit Weiß ein Massaker anrichtete.
 
Wir hätten gerne gesehen, was AlphaZero gegen Sizilianisch oder Grünfeld ausgeklügelt hatte, aber dazu kam es nicht. Immerhin ergab sich für Freunde des Damenindischen allein auf Basis der zehn bekannten Partien eine Menge Anschauungsmaterial. Viel ist schon über diese zehn Partien geschrieben worden, aber meist im Sinne von Schlaglichtern auf spektakuläre Momente (Leser der englischen Chessbase-Seite kennen zum Beispiel schon den in den Kommentaren zu Zug 16 zitierten taktischen Knaller Lg5!!).
 
AlphaZeros Spiel ist in der Tat spektakulär, aber vor allem ist es für eine Maschine spektakulär konsistent und positionell druckvoll. Taktische Feuerwerke abzubrennen, mag sich gelegentlich ergeben, aber das reflektiert nicht den eigentlichen Stil des AlphaZero-Schachs, das in erster Linie auf Dominanz und tiefem „Verstehen“ basiert und zu Partien aus einem Guss führt.
 
Die folgende Begegnung zeigt das sehr schön. Sie ließe sich mit einem Fußballspiel vergleichen, in dem eine brillante auf eine solide Mannschaft trifft. Die solide Truppe ist austrainiert, prima organisiert, entwickelt zwar keiner Torgefahr, aber sie macht es dem Gegner schwierig, Chancen herauszuarbeiten. Die brillante Elf (bzw. Sechzehn) muss ihr gesamtes Repertoire abrufen, mal das Tempo herausnehmen, mal anziehen, mal den Gegner herauslocken, dann wieder einschnüren, um am Ende einem müde gespielten Widersacher den einen entscheidenden Treffer zuzufügen.

 

In der nächsten Partie spielte Zugzwang eine wichtige Rolle:

 

Und hier noch ein weiteres Beispiel:

 


In einem Vortrag erläuterte David Silver von Deep Mind kürzlich noch einmal die Vorgehensweise  beim Machine Learning.

Und das sagt Garry Kasparov über die Entwicklung der künstlichen Intelligenz:

 

 




Conrad Schormann, gelernter Tageszeitungsredakteur, betreibt in Überlingen am Bodensee ein Büro für Redaktion und Kommunikation. Fürs Schachspielen hat er zu wenig Zeit, was auch daran liegt, dass er so gerne darüber schreibt, sei es für Chessbase, im Reddit-Schachforum oder für sein Schach-Lehrblog Perlen vom Bodensee...

Discussion and Feedback Join the public discussion or submit your feedback to the editors


Diskutieren

Regeln für Leserkommentare

 
 

Noch kein Benutzer? Registrieren

beyondCritics beyondCritics 29.03.2018 09:04
"Stockfischs Algorithmus ist nicht deterministisch. ...". Eine kleine Korrektur: dies stimmt nur, wenn mehrere Threads verwendet werden und ist dann unvermeidlich. Bei nur einem Thread ist der Suchbaum auf jeder Plattform identisch.
1