The Thinking Game - Die Geschichte von Deep Mind

von André Schulz
26.11.2025 – Die Firma DeepMind Technologies hat die KI-Forschung revolutioniert und im Laufe ihrer noch recht kurzen Geschichte viele wertvolle Ergebnisse und Durchbrüche erzielt. Mit ihren Go- und Schachprogrammen AlphaGo und AlphaZero erregte DeepMind in der Spieleszene großes Aufsehen, aber natürlich geht es um weit mehr, als Spiele zu gewinnen. Auf dem Tribeca Festival wurde ein spannender Film gezeigt.

Ihr persönlicher Schachtrainer. Ihr härtester Gegner. Ihr stärkster Verbündeter.
FRITZ 20: Ihr persönlicher Schachtrainer. Ihr härtester Gegner. Ihr stärkster Verbündeter. FRITZ 20 ist mehr als nur eine Schach-Engine – es ist eine Trainingsrevolution für ambitionierte Spieler und Profis. Egal, ob Sie Ihre ersten Schritte in die Welt des ernsthaften Schachtrainings machen oder bereits auf Turnierniveau spielen: Mit FRITZ 20 trainieren Sie effizienter, intelligenter und individueller als je zuvor.

Die Geschichte von DeepMind Technologies ist eine ganz besondere Erfolgsgeschichte. 2010 gründeten Demis Hassabis, Shane Legg und Mustafa Suleyman in London die Firma und beschäftigten sich intensiv mit dem Thema Künstliche Intelligenz. Im ersten Schritt untersuchten sie, wie das menschliche Gehirn arbeitet. Dann bildeten sie die Struktur des menschlichen Gehirns nach, entwickelten Lernalgorithmen und konstruierten künstliche neuronale Netzwerke, in denen das zuvor Gelernte gespeichert werden konnte. Um die Denkprozesse flexibel zu gestalten, wurden auch „Kurzzeitgedächtnisse“ entwickelt.

Sehr schnell wurden Investoren und andere Hightech-Unternehmen auf das junge Unternehmen aufmerksam. Zu den Geldgebern gehörten Elon Musk (Tesla, SpaceX), Peter Thiel (PayPal), Jaan Tallinn (Skype), Scott Banister (Business Angel) und Li Ka-shing (Horizon Ventures). In einem Bieterwettbewerb stach Google LLC 2014 Mark Zuckerbergs Facebook aus und übernahm DeepMind Technologies zu einem geschätzten Kaufpreis von 400 Mio. USD.

Das Cambridge Computer Laboratory hatte DeepMind 2014 zudem als „Company of the Year“ ausgezeichnet.

Zur Überprüfung ihrer Ansätze beschäftigte sich DeepMind mit einer Vielzahl von Strategiespielen und entwickelte Programme, die in der Lage waren, diese Spiele von Grund auf zu lernen und ihre Fähigkeiten bis zur Perfektion weiterzuentwickeln.

2017 erregte DeepMind mit seiner Entwicklung AlphaGo bzw. AlphaGo Zero großes Aufsehen. Go galt bis dahin als besonders schwierige Aufgabe für Programme, da die Anzahl der Steine und Möglichkeiten sehr viel größer ist als beispielsweise beim Schach. AlphaGo besiegte aber schon 2015 den mehrfachen Europameister Fan Hui und 2017 schließlich den weltbesten Go-Spieler Lee Sedol in Wettkämpfen.

Im nächsten Schritt nahmen sich die DeepMind-Entwickler das Schachspiel vor. Hier war die Schlacht zwischen Menschen und Maschinen schon seit einiger Zeit zugunsten der Schachprogramme entschieden. Weltmeister Kasparov hatte 1997 gegen den IBM-Rechner Deep Blue verloren, Weltmeister Kramnik 2006 gegen das Software-Programm Deep Fritz. Inzwischen hatte sich das Open-Source-Programm Stockfish als stärkstes Schachprogramm etabliert und wurde als Gegner für DeepMind auserkoren. In einer Serie von Wettkämpfen wurde das weltbeste Software-Programm von AlphaZero vernichtend geschlagen.

Demis Hassabis im Gespräch mit GM Matthew Sadler

Besonders verblüffend ist dabei, dass die DeepMind-Programme bei Null anfangen. Sie erhalten die Regeln des betreffenden Spiels als Grundlage und beginnen dann mit der sogenannten Monte-Carlo-Methode, das Spiel zu lernen. Monte-Carlo-Methode bedeutet, dass das Programm mit hoher Geschwindigkeit eine riesige Anzahl von Partien gegen sich selbst spielt, analysiert, mit welchen Berechnungen oder Strategien es in Vorteil kommt, und die Erkenntnisse in seinem neuronalen Netzwerk abspeichert. Als Subunternehmen von Google konnte DeepMind bei seinen Entwicklungen die gewaltigen Serverparks des Konzerns nutzen und so in kurzer Zeit unvorstellbar große Mengen von Partien spielen.

Die Monte-Carlo-Methode war bei Spieleprogrammierern durchaus bekannt und kam auch schon bei der Entwicklung von Schachprogrammen zur Anwendung. Während einer Partie spielt dabei das Programm im Denkprozess in großer Geschwindigkeit Partien gegen sich selbst, probiert verschiedene Möglichkeiten aus und wählt dann den Zug mit dem besten Ergebnis bzw. der größten Gewinnwahrscheinlichkeit. Die Methode war bei Schachprogrammierern im Vergleich mit der herkömmlichen Alpha-Beta-Rechenmethode jedoch lange etwas unterschätzt. Inzwischen sieht das anders aus.

Natürlich hat sich DeepMind Technologies nicht die Aufgabe gestellt, mit seinen Programmen Spiele zu gewinnen. Es geht um sehr viel größere Dinge. Die Beschäftigung mit Spielen diente nur der Verfeinerung der Methoden.

Das Programm AlphaTensor (2022) beispielsweise beschäftigt sich mit der Optimierung bei der Matrixmultiplikation. AlphaEvolve (2025) ist ein KI-Agent, der als Programmierwerkzeug entwickelt wurde. Bestimmte Aufgaben werden als Algorithmen formuliert und von AlphaEvolve mithilfe von Large Language Models (LLMs) wie Gemini in iterativen Schritten optimiert.

Mit AlphaFold und AlphaFold2 gelang es DeepMind, die Vorhersagen der Proteinentfaltung erheblich zu verbessern, sodass dieses Problem in der Strukturbiologie inzwischen als gelöst gilt. AlphaFold wird von vielen als das bisher wichtigste Ergebnis in der KI-Entwicklung angesehen. Darüber hinaus hat DeepMind noch eine Reihe weiterer bahnbrechender Algorithmen entwickelt, die bei verschiedenen Aufgaben zur Anwendung kommen.

Demis Hassabis

Für seine Forschungen wurde Demis Hassabis zusammen mit John Jumper 2024 mit dem Nobelpreis für Chemie ausgezeichnet.

Zur Entwicklungsgeschichte von DeepMind ist nun ein abendfüllender Dokumentarfilm entstanden, der auch auf dem Tribeca Festival in New York gezeigt wurde.

Links


André Schulz, seit 1991 bei ChessBase, ist seit 1997 der Redakteur der deutschsprachigen ChessBase Schachnachrichten-Seite.
Diskussion und Feedback Senden Sie Ihr Feedback an die Redakteure