0 Daumen
1,3k Aufrufe


ich experimentiere gerade mit künstlichen Intelligenzen und habe ein einfaches Programm programmiert, das Tic Tac Toe gegen einen Gegner "lernt". Der Gegner wählt dabei völlig zufällige Züge und der Computer versucht, möglichst oft zu gewinnen. Der Gegner beginnt immer. Der Computer erreicht dabei nach einer gewissen Zeit eine maximale durchschnittliche Gewinnrate von 70% gegen den Gegner, der zufällig agiert. Die anderen 30% bestehen aus Verlieren und Unentschieden.

Ist das ein optimales Ergebnis, oder geht es theoretisch noch besser?

Danke,

Thilo :)
Avatar von 4,3 k

1 Antwort

0 Daumen
Also ich habe gerade ausgerechnet das es nur 9! / 5! / 4! = 126 Möglichkeiten gibt ein Tic Tac Toe Feld auszufüllen. Und in diesen 126 Sind Drehhungen und Spiegelungen noch nicht mit enthalten.

Ich glaube es ist immer Möglich so zu spielen, das der der Anfängt nicht gewinnt. Daher wäre es optimal, wenn dem Programm nach eine gewissen Zeit kein Fehler mehr passiert. Gerade wenn der Gegner nur blind spielt.

Wie machst du das denn ? Also setzt du zuanfang auch nur blind und analysierst du im Nachhinein die Stellung die zum Verlust geführt hat?
Avatar von 488 k 🚀

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Mathelounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community