THE FORUMS


German ForumsGeneral DiscussionStrategyFrench Forum
Old May 11, 2013, 11:00am   #1
nizzle
back to school
 
nizzle's Avatar
 
Join Date: Jan 2007
Posts: 5,582
Reputation: 17200
nizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond repute
Default Pokeragent programmieren

Howdie,
in der Hoffnung, dass hier überhaupt noch jemand mitliest:

Wir müssen in einer Vorlesung als Projekt einen intelligenten Pokeragenten Programmieren, der dann am Ende des Projekt gegen die anderen Agenten antritt.

Habt ihr irgendwelche generellen Tipps was Taktik o.ä. angeht? Ideen für Lernverfahren oder Optimierungsalgorithmen?
__________________
There are only 10 types of people in the world — those who understand binary and those who don't.
nizzle est déconnecté   Reply With Quote

Sponsored Links
Don't like this ad? Register to make it go away!

Old May 13, 2013, 8:21am   #2
wolfcastle
Grinder
 
wolfcastle's Avatar
 
Join Date: Jan 2009
Location: Springfield
Posts: 705
Reputation: 2698
wolfcastle has a reputation beyond reputewolfcastle has a reputation beyond reputewolfcastle has a reputation beyond reputewolfcastle has a reputation beyond reputewolfcastle has a reputation beyond reputewolfcastle has a reputation beyond reputewolfcastle has a reputation beyond reputewolfcastle has a reputation beyond reputewolfcastle has a reputation beyond reputewolfcastle has a reputation beyond reputewolfcastle has a reputation beyond repute
Send a message via ICQ to wolfcastle
Default

Kommt drauf an was ihr so könnt.
Am Einfachsten wäre es mit Entscheidungsbäumen zu arbeiten. Wenn die Starr sind sind sie natürlich am Einfachsten zu exploiten.
Wenn ihr etwas besser seit, baut ihr sich selbst erweiternde Entscheidungsbäume, eventuell mit Anbindung an einen Tracker.
Nen bissel Advanced sind neuronale Netze das haben ein paar Studikollegen von mir gemacht das sah richtig gut aus.
__________________
Quote:
Er spricht deutsch er kann kein schlechter Mensch sein!
wolfcastle est déconnecté   Reply With Quote
Old May 19, 2013, 7:38pm   #3
BubbleBoy
BubbleBoy
 
BubbleBoy's Avatar
 
Join Date: Sep 2006
Location: BubbleBoy
Posts: 11,484
Reputation: 28914
BubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond reputeBubbleBoy has a reputation beyond repute
This member received this PokerTips Exclamation Mark for one of a number of reasons: blogging, winning a contest, contributing great content, etc. Keep an eye out for chances to receive one of these by your profile!
Default

Welche Poker Variante denn?

Je nachdem wie gross der decision space ist, also #moeglicher situation die man haben kann, schraenkt das die Auswahl schonmal ein.

Ein Neuronet was Poker lernt will ich mal sehen, wie soll das gehen? Nicht dass es nicht ginge, aber kann mir das nicht ansatzweise vorstellen wo du da anfangen willst.
__________________

BubbleBoy est déconnecté   Reply With Quote
Old May 22, 2013, 12:41pm   #4
corny
Professional
 
Join Date: May 2007
Posts: 1,566
Reputation: 17008
corny has a reputation beyond reputecorny has a reputation beyond reputecorny has a reputation beyond reputecorny has a reputation beyond reputecorny has a reputation beyond reputecorny has a reputation beyond reputecorny has a reputation beyond reputecorny has a reputation beyond reputecorny has a reputation beyond reputecorny has a reputation beyond reputecorny has a reputation beyond repute
Default

http://www.mattmazur.com/category/poker-bot/

hier findest du eigentlich genug dazu.
corny est déconnecté   Reply With Quote
Old May 22, 2013, 3:00pm   #5
nizzle
back to school
 
nizzle's Avatar
 
Join Date: Jan 2007
Posts: 5,582
Reputation: 17200
nizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond repute
Default

Quote:
Originally Posted by BubbleBoy View Post
Welche Poker Variante denn?
Wenn ich richtig informiert bin, dann ist ein Texas Hold'em No Limit Turnier.

@corny: Danke, werds mir mal anschauen.
__________________
There are only 10 types of people in the world — those who understand binary and those who don't.
nizzle est déconnecté   Reply With Quote
Old May 27, 2013, 1:31am   #6
Schrapp
Professional
 
Schrapp's Avatar
 
Join Date: Sep 2006
Posts: 1,979
Reputation: 3557
Schrapp has a reputation beyond reputeSchrapp has a reputation beyond reputeSchrapp has a reputation beyond reputeSchrapp has a reputation beyond reputeSchrapp has a reputation beyond reputeSchrapp has a reputation beyond reputeSchrapp has a reputation beyond reputeSchrapp has a reputation beyond reputeSchrapp has a reputation beyond reputeSchrapp has a reputation beyond reputeSchrapp has a reputation beyond repute
Default

Quote:
Originally Posted by corny View Post
http://www.mattmazur.com/category/poker-bot/

hier findest du eigentlich genug dazu.
Sieht mir nach einem regelbasierten Bot aus, den der programmiert hat. Damit kommst du auf keinen grünen Zweig. Was nicht heißen muss, dass ein guter regelbasierter Bot nicht trotzdem gegen die anderen Bots deiner Kommilitonen gewinnen könnte, wenn die auch so an die Sache herangehen.. aber gegen einen guten Pokerspieler oder auch gegen einen guten Bot nicht.

Das Format ist halt super wichtig, Texas Hold'em Turnier ist nicht wirklich aussagekräftig. Deep Stack 9 max Turnier? NL? FL? Heads-Up MMT, wo immer der Gewinner an einem Tisch in die nächste Runde kommt?

Würde ja eigentlich erwarten, dass man an der Uni sich mit FL HU beschäftigen würde, aber wer weiß. In dem Fall wäre jedenfalls die Master-Arbeit von Johanson von der University Alberta ( http://poker.cs.ualberta.ca/publicat...hanson.msc.pdf ) eine Standardquelle. Für die Dinge, die er beschreibt, insbesondere Counterfactual Regret Minimization (CFRM) (in Kapitel 3) dürfte man mittlerweile bestimmt viel freien Code im Netz finden. Und ein "simpler" CFRM-Bot dürfte jeden regelbasierten Bot in die Tasche stecken, wenn die Spielabstraktion gut genug gewählt ist (und somit das epsilon-Nashequilibrium "close enough" ist). Exploited zwar die Gegner nicht sondern versucht, am GTO zu spielen, aber das reicht gegen schlechte Spieler, und aufbauend darauf kannst du immer noch Opponent Modeling einsetzen.

Bei NL wird das ganze noch mal komplizierter, und SH oder FR dann sowieso noch mehr. Keine Ahnung, wie motiviert du tatsächlich bist. Letztlich ist es ja "nur" ein Uniprojekt. Einen guten Pokeragent zu schreiben, selbst für FL HU, ist ne Mammutaufgabe. Insbesondere, weil die Einarbeitung in den aktuellen Stand der Forschung schon viel Zeit verschlingt, und dann hat man noch nichts umgesetzt.
__________________
"Well, I figured he had AA so that means my 44 is the same as KK and I'm never folding KK there."
Schrapp est déconnecté   Reply With Quote
Old Jun 05, 2013, 11:54am   #7
nizzle
back to school
 
nizzle's Avatar
 
Join Date: Jan 2007
Posts: 5,582
Reputation: 17200
nizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond repute
Default

Quote:
Originally Posted by Schrapp View Post
Das Format ist halt super wichtig, Texas Hold'em Turnier ist nicht wirklich aussagekräftig. Deep Stack 9 max Turnier? NL? FL? Heads-Up MMT, wo immer der Gewinner an einem Tisch in die nächste Runde kommt?
Ist Full Ring Sit and Go. Winner takes it all.
Startstack ist default 1000, BB am Anfang 20. Weiß grade nicht wie schnell die Blinds erhöht werden, aber denke schon recht schnell.
__________________
There are only 10 types of people in the world — those who understand binary and those who don't.
nizzle est déconnecté   Reply With Quote
Old Jul 17, 2013, 11:52am   #8
nizzle
back to school
 
nizzle's Avatar
 
Join Date: Jan 2007
Posts: 5,582
Reputation: 17200
nizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond reputenizzle has a reputation beyond repute
Default

Heute war das Turnier. Ingesamt 5 Gruppe mit je 2 Spielern (eine Gruppe hat nur einen Agenten gestellt, da der andere eine zu hohe Laufzeit hatte), also insgesamt 9 Spieler.
Der eine Spieler pro Gruppe war ein ganz normaler Pokerspieler, die festcodierten Regeln usw.. Der andere sollte ein intelligenter Pokerspieler sein. Wir haben uns für LCS (learning classifier system) als Lernalgorithmen entschieden.

Neuronale Netze hatten wir bei einer anderen Aufgabe schon verwendet, dort war es aber aufgrund der schlechten Trainingsdaten um einiges schlechter als ein random Algorithmus. Da es schwierig gewesen wäre viele gute Trainingsdaten zu erstellen, haben wir Neuronale Netze nicht genommen.

Gespielt wurden 2000 9 Man Sit'n'Gos. Unser lernende Pokerspieler hat über 400 davon gewonnen & unser nicht lernender hat über 300 gewonnen.
Also Platz 1 und 2 für uns...weeeeeeeee

Man muss aber sagen, dass unsere beiden Pokerspieler eigentlich genau das gleiche gemacht habe, nur bei unserm lernenden ist uns noch ein Fehler aufgefallen, den wir dann behoben haben. Sonst wären die beiden etwa gleich gut gewesen.

Falls Interesse besteht, kann ich noch ein bisschen zu den Regeln die wir implementiert haben sagen.
__________________
There are only 10 types of people in the world — those who understand binary and those who don't.
nizzle est déconnecté   Reply With Quote
Reply

Bookmarks

Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off
Forum Jump



All times are GMT. The time now is 2:47am. vBulletin 3.7.4 Copyright ©2000 - 2017, Jelsoft Enterprises Ltd.