Перейти к содержимому
black_dead77

Насколько сильны боты в Лимитном Холдеме ?

Recommended Posts

Насколько сильны боты в Лимитном Холдеме ?

Изображение

На TwoPlusTwo появился очередной топик, в котором опять обсуждается «решаемость холдема» (то есть, можно ли написать такого бота, который будет играть не меньше, чем в ноль). Началось всё достаточно безобидно, автор лишь вопросил, можно ли считать 6макс гипертурбо сателлиты (где у вас изначально 10 бб) решёнными… В этой статье также будут выложены мнения покеристов, игравших против ботов или имевших с ними дело в какой-то иной степени.

Maton808 шутливо подкинул дровишек в костерок, выложив график одного из самых известных 6макс сателлитчиков в мире Jorj95. Однако после этого разговор пошёл совсем в другом русле.

Изображение

ohsosick, кажется, любит раскачивать лодку:

«Хедз-ап лимитного холдема уже решили в этом году. Безлимитный хедз-ап со стеками в 200 бб решён не до конца, однако лучший современный бот бьёт второго по силе с эджем в 0.3бб/100 на дистанции в миллион рук.

Изображение

На протяжении ста тысяч рук один бот смог выиграть у другого всего лишь 670 блайндов. Они играют очень близко к нэшу.

6макс решить тяжелее, поскольку нужны большие вычислительные мощности».

На это ему, конечно, возразили, что преимущество одного сильного бота над другим совершенно не означает, что программа будет сильнее игроков.

В январе 2013 года прошла специальная конференция разработчиков покерных ботов , в ходе которого создатели Neo Poker Bot заявили, что они «якобы решили» лимитный хедз-ап холдем. Под «якобы решили», я понимаю здесь то, что они до конца просчитали «поиск по игровому древу». Это не «решение LHE», а несколько иной способ справиться с проблемами.

Shalako поделился своим опытом игры против NeoPoker Bot, но в безлимитный, а не лимитный холдем:

«Я сыграл против этого бота несколько сотен рук, и он абсолютно ужасен в безлимитном хедз-апе. Во-первых, я заметил, что он фолдит на трибет в 95% случаев. У него также отсутствует рендж колла 3бета, то есть он либо пушит, либо фолдит. Так что без позиции вам нужно просто трибетить каждую руку и падать на его олл-ин. Он рейзит порядка 90% батонов, так что трибет будет крайне эффективен. Я также рейзил 90% батонов, а его диапазон колла был достаточно типичен и предсказуем: бродвеи, одномастные тузы и так далее. Он 3бетит верхние 10%, а если стек меньше, то шире, конечно.

На постфлопе он слишком тайтов, и положить его на конкретный диапазон не составляет труда. Боту также трудно справиться с чек-рейзам и дабл/трипл-барелями. Если он рейзит, то у него как минимум две пары. Не встречал блеф-рейзов от него. Программа также не замечает разницы в размере ставок и не делает из этого никаких выводов.

Большинство ботов плохо справляются с агрессией, и этот не является исключением. Слабости программы стали очевидны после нескольких сотен рук.

Update: Сыграл ещё несколько сотен, и он наконец-то стал колировать мои трибеты, но не в достаточной мере, чтобы «убить» моё преимущество при 100% трибете. Я также увидел от него блеф-рейз на весь стек с нижней парой, что было достаточно интересным решением на той текстуре борда».

В топик на twoplustwo на коне врывается phd-студент по математике:

«Привет, котаны! Меня зовут Майк Йохансон, и я являюсь одним из тех, кто разработал Hyperborean и Polaris (одни из самых известных покерных ботов во Вселенной). Меня попросили отписаться в тредике, можно ли считать лимитный холдем решенный. Не читал весь ваш трэш, но всё равно слушайте.

Хедз-ап лимитный холдем не решён. Пару лет назад я писал, что мы можем определить, насколько бот близок к равновесию нэша , рассчитывая, как много он будет терять против превосходного противника. При настоящем равновесии Нэша потери будут составлять 0$ за игру. И чем меньше ваша эксплоитность, тем ближе вы к Нэшу.

В 2011 году я писал, что наши лучшие стратегии в 2008 году на соревновании «человек против машины» имели предел эксплуатируемости в 11.75ББ/100. Лучшие стратегии 2011 года держались лучше, их могли эксплоатить где-то 5ББ/100.

С того момента мы очень далеко продвинулись. Наш последний алгоритм, CFR-BR, позволяет нам ещё сильнее приблизиться к равновесию Нэша. В этом материале наша стратегия была эксплоитна на 2ББ/100. С того момента мы продвинулись ещё дальше, однако на соревнование новую разработку не отсылали. В университете мы очень близки к эквилибриуму, но ещё не дошли до него.

ИСТОЧНИК

Изменено пользователем black_dead77

Поделиться сообщением


Ссылка на сообщение

тк темой моего неоконченного диссера были близкие темы - я понимаю, все вкладывают в термин "решен" разное содержаниеполностью "решенного" лимитного холдема нет, но ответ парня из разработки абсолютно понятен - подавляющее большинство людей на земле их алгоритм уже обыграет )

Поделиться сообщением


Ссылка на сообщение

самообучающийся алгоритм, и амба. мощности давно не проблема, кластеры создать как два пальца, вопрос в том, что это грааль, и хрен кто его в паблик выложит. держите карман шире.

Поделиться сообщением


Ссылка на сообщение

Создайте аккаунт или войдите для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!

Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.

Войти сейчас

×