| Both sides previous revision Previous revision | |
| ai [2014/11/28 08:08] – image net beckmanf | ai [2025/12/13 15:15] (current) – add reinforcement learning papers for breakout beckmanf |
|---|
| ===== Artificial Intelligence ===== | ===== Artificial Intelligence ===== |
| |
| | ==== Basics ==== |
| [[http://arxiv.org/abs/1003.0358|D. Ciresan, U. Meier, L. Gambardella and J. Schmidhuber, "Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition", Neural Computation, Volume 22, Number 12, December 2010]] | [[http://arxiv.org/abs/1003.0358|D. Ciresan, U. Meier, L. Gambardella and J. Schmidhuber, "Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition", Neural Computation, Volume 22, Number 12, December 2010]] |
| |
| [[http://image-net.org]] | [[http://image-net.org]] |
| |
| Wettbewerb für die Bilderkennung mit den Bereichen Klassifikation mit 1000 Klassen und Lokalisierung in einem Bild. Dabei stehen 1.2 Millionen Bilder für das Training zur Verfügung. | Wettbewerb für die Bilderkennung mit den Bereichen Klassifikation mit 1000 Klassen und Lokalisierung in einem Bild. Dabei stehen 1.2 Millionen Bilder für das Training zur Verfügung. |
| | |
| | ==== Breakout / Deepmind / Reinforcement Learning ==== |
| | |
| | Der [[breakout|GPU Rechner "breakout"]] hat seinen Namen anlässlich der Veröffentlichung von Deepmind bekommen, die zeigt, wie man mit Maschinenlernen (hier Reinforcement Learning) einen Computer das Spiel [[https://de.wikipedia.org/wiki/Breakout_(Computerspiel)|Breakout]] spielen lassen kann. breakout wurde 1976 von Atari als Spielhallenautomatenspiel veröffentlicht. Der Entwickler des Spiels ist |
| | [[https://de.wikipedia.org/wiki/Steve_Wozniak|Steve Wozniak]]. Er hat [[https://db.hfsplay.fr/files/2019/06/14/4cfe7768-0c49-477b-b55f-61b6254fa435.pdf|45 TTL ICs]] benötigt. Hier ein [[https://youtu.be/BNqA7MTDUY8|Youtubevideo vom Breakoutspiel]]. |
| | |
| | |
| | [[http://www.incompleteideas.net/book/RLbook2020.pdf|Richard S. Sutton and Andrew G. Barto, "Reinforcement Learning - An Introduction", Second Edition, online, 2020]] |
| | |
| | Das Standardeinführungsbuch für Reinforcement Learning. |
| | |
| | [[https://web.stanford.edu/class/psych209/Readings/MnihEtAlHassibis15NatureControlDeepRL.pdf|Volodymyr Mnih et al., "Human-level control through deep reinforcement learning", Nature, Vol. 518, 2015]], [[https://www.nature.com/articles/nature14236|Verlagsseite bei Nature]] |
| | |
| | Die Veröffentlichung von den Leuten von [[https://de.wikipedia.org/wiki/DeepMind|Deepmind]], die mit Reinforcement Learning gelernt haben Atari Spiele wie [[https://de.wikipedia.org/wiki/Breakout_(Computerspiel)|Breakout]] oder Space Invaders zu spielen. Sensationell. In einem [[https://static-content.springer.com/esm/art%3A10.1038%2Fnature14236/MediaObjects/41586_2015_BFnature14236_MOESM124_ESM.mov|Video auf der Natureseite]] kann man sehen wie sich das Spielverhalten für breakout mit mehr gespielten Spielen immer weiter verbessert. |
| | |