ich experimentiere gerade mit künstlichen Intelligenzen und habe ein einfaches Programm programmiert, das Tic Tac Toe gegen einen Gegner "lernt". Der Gegner wählt dabei völlig zufällige Züge und der Computer versucht, möglichst oft zu gewinnen. Der Gegner beginnt immer. Der Computer erreicht dabei nach einer gewissen Zeit eine maximale durchschnittliche Gewinnrate von 70% gegen den Gegner, der zufällig agiert. Die anderen 30% bestehen aus Verlieren und Unentschieden.
Ist das ein optimales Ergebnis, oder geht es theoretisch noch besser?
Danke,
Thilo :)