ai

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
ai [2014/11/27 14:35] – created beckmanfai [2025/12/13 15:15] (current) – add reinforcement learning papers for breakout beckmanf
Line 1: Line 1:
-===== Artifical Intelligence =====+===== Artificial Intelligence =====
  
 +==== Basics ====
 [[http://arxiv.org/abs/1003.0358|D. Ciresan, U. Meier, L. Gambardella and J. Schmidhuber, "Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition", Neural Computation, Volume 22, Number 12, December 2010]] [[http://arxiv.org/abs/1003.0358|D. Ciresan, U. Meier, L. Gambardella and J. Schmidhuber, "Deep Big Simple Neural Nets Excel on Handwritten Digit Recognition", Neural Computation, Volume 22, Number 12, December 2010]]
  
Line 8: Line 9:
  
 Beschreibung der GPU Implementierung eines Convolutional Neural Networks (CNN) und Ergebnisse für Handschriftenerkennung ([[http://yann.lecun.com/exdb/mnist/|MNIST]]) (2-7 hidden layer), Stereobildern ([[http://www.cs.nyu.edu/~ylclab/data/norb-v1.0/|NORB]]) (5 hidden layer) und Klassifikation von Bildern ([[http://www.cs.toronto.edu/~kriz/cifar.html|CIFAR10]]) in 10 Klassen (Flugzeug, Auto, Katze u.s.w.).  Beschreibung der GPU Implementierung eines Convolutional Neural Networks (CNN) und Ergebnisse für Handschriftenerkennung ([[http://yann.lecun.com/exdb/mnist/|MNIST]]) (2-7 hidden layer), Stereobildern ([[http://www.cs.nyu.edu/~ylclab/data/norb-v1.0/|NORB]]) (5 hidden layer) und Klassifikation von Bildern ([[http://www.cs.toronto.edu/~kriz/cifar.html|CIFAR10]]) in 10 Klassen (Flugzeug, Auto, Katze u.s.w.). 
 +
 +[[http://people.idsia.ch/~juergen/deeplearning.html|Deep Learning am IDSIA]]
 +
 +Beschreibung "Deep Learning" am IDSIA (Schweizer Institut für AI). Die haben neun Wettbewerbe für Klassifikation gewonnen. 
 +
 +[[http://image-net.org]]
 +
 +Wettbewerb für die Bilderkennung mit den Bereichen Klassifikation mit 1000 Klassen und Lokalisierung in einem Bild. Dabei stehen 1.2 Millionen Bilder für das Training zur Verfügung.
 +
 +==== Breakout / Deepmind / Reinforcement Learning ====
 +
 +Der [[breakout|GPU Rechner "breakout"]] hat seinen Namen anlässlich der Veröffentlichung von Deepmind bekommen, die zeigt, wie man mit Maschinenlernen (hier Reinforcement Learning) einen Computer das Spiel [[https://de.wikipedia.org/wiki/Breakout_(Computerspiel)|Breakout]] spielen lassen kann. breakout wurde 1976 von Atari als Spielhallenautomatenspiel veröffentlicht. Der Entwickler des Spiels ist 
 +[[https://de.wikipedia.org/wiki/Steve_Wozniak|Steve Wozniak]]. Er hat [[https://db.hfsplay.fr/files/2019/06/14/4cfe7768-0c49-477b-b55f-61b6254fa435.pdf|45 TTL ICs]] benötigt. Hier ein [[https://youtu.be/BNqA7MTDUY8|Youtubevideo vom Breakoutspiel]].
 +
 +
 +[[http://www.incompleteideas.net/book/RLbook2020.pdf|Richard S. Sutton and Andrew G. Barto, "Reinforcement Learning - An Introduction", Second Edition, online, 2020]]
 +
 +Das Standardeinführungsbuch für Reinforcement Learning.
 +
 +[[https://web.stanford.edu/class/psych209/Readings/MnihEtAlHassibis15NatureControlDeepRL.pdf|Volodymyr Mnih et al., "Human-level control through deep reinforcement learning", Nature, Vol. 518, 2015]], [[https://www.nature.com/articles/nature14236|Verlagsseite bei Nature]]
 +
 +Die Veröffentlichung von den Leuten von [[https://de.wikipedia.org/wiki/DeepMind|Deepmind]], die mit Reinforcement Learning gelernt haben Atari Spiele wie [[https://de.wikipedia.org/wiki/Breakout_(Computerspiel)|Breakout]] oder Space Invaders zu spielen. Sensationell. In einem [[https://static-content.springer.com/esm/art%3A10.1038%2Fnature14236/MediaObjects/41586_2015_BFnature14236_MOESM124_ESM.mov|Video auf der Natureseite]] kann man sehen wie sich das Spielverhalten für breakout mit mehr gespielten Spielen immer weiter verbessert.
 +
 +
  • ai.1417095307.txt.gz
  • Last modified: 2014/11/27 14:35
  • by beckmanf