-
Сейчас в сети 0 пользователей, 0 анонимных, 438 гостей (Полный список)
Нет пользователей в сети в данный момент.
-
Сейчас популярно
-
PokerStars Live (EPT, EUREKA и др): новости, обсуждение
Автор: DOGGYLA, в Оффлайн покер в Казахстане и мире
- 11 ответов
- 5177 просмотров
-
-
Похожие публикации
-
Автор: Paks13
На форуме ГТ появилась тема.
Больше она к размышлению о Ботах, и о вероятности их в разных сетях.
Здравствуйте форумчане, как вы уже поняли речь пойдёт об очень серьёзной проблеме.
По определённым причинам мы вынуждены сохранять анонимность, доказательства,
предоставленные нами может легко проверить любой желающий с помощью ХМ2. Как вы знаете,
некоторое время назад были блокировки больших сетей ботов в апокере и покерстарс,
сейчас они обосновались на 888 (или других румах сети пасифик), но на лимитах пониже нл50-100.
Это те же, ребята (мы общались с автором прошлой темы Матвеем,
при необходимости он подтвердит). Все они русские, у них те же супернизкие фолды на
кбет, высокий ВВСФ, высокий ВТСД. Они накатывают самые большие дистанции среди
регуляров ежемесячно. Естественно статы совпадают между собой, и не только эти.
Есть ряд уникальных статов, по которым их легко вычислить, но мы бы хотели оставить
их в секрете, показав только совпадение нескольких десятков основных статов.
Отличительной особенностью лагботов является то что они не идут выше при почтенной
для 888 дистанции и отличном винрейте.
Кроме того мы обнаружили другую группу ботов, которая играет более тайтово префлоп
и может быть просто модификацией первой группы (согласитесь, 20 суперплюсовых лагов
для небольшой сети было бы слишком подозрительно) или же просто другой сетью из Росиии.
Мы осознаём минусы публичного поста, он может отпугнуть рекреационных игроков,
а так же дать ботоводам подсказку, где подкрутить в следующий раз. Но выхода
у нас нет, поскольку 888 отделывается стандартными отписками вроде "будем
расследовать, результаты огласить не можем". Мы собрали все необходимые
доказательства за 3 дня, после этого 888 "расследует" уже месяц (считая от
их ответа, на который понадобилась ещё неделя). Тем временем боты продолжают
играть. Более того, у нас есть серьёзные опасения, что ботоводы гуглят себя каждый
день, и при первом упоминании выведут банкроллы, но мы считаем, что ответственность
будет лежать исключительно на службе безопасности сети.
Ники ботов:
botnet 1 (lags):
Trolltracker
Aggrophob
Waitlistreg
Blindviy13
botnet 2 (tags):
urmessioli
6u6lik
Haxpanom
idlike2win
validmad0
tinaterna
xavierhern
f19117
minitrashy
patronpa
Nellyskip
B3tshark
Yonikakan
barglot
qapetskas
qotoclism
Статы:
-
Автор: GlavFish
В журнале Science вышла статья, где описывается принцип работы системы искусственного интеллекта Libratus. В начале года она победила в 20-дневном покерном турнире и выиграла у профессиональных игроков в покер фишек на сумму более 1,7 миллиона долларов.
Активное развитие технологий машинного обучения привело к созданию алгоритмов, которые справляются со многими задачами лучше людей. Особое внимание в этом году получили программы, которые научились обыгрывать людей в играх с неполной информацией — традиционно это считалось невозможным. В январе 2017 года система искусственного интеллекта Libratus победила в турнире по техасскому холдему, который сегодня считается наиболее популярной разновидностью покера. Во время турнира, который длился 20 дней, алгоритм заработал более 1,7 миллиона долларов в фишках. В новой статье Ноэм Браун (Noam Brown) и Туомас Сандхолм (Tuomas Sandholm), разработчики Libratus, описали, как работает алгоритм.
Libratus состоит из трех основных частей. Для первых кругов покера используется модуль, который рассматривает игру как абстракцию. Вместо того, чтобы учитывать все точки принятия решений, число которых достигает 10161, он упрощает игру, при этом максимально учитывая стратегические аспекты оригинальной игры. Так, Libratus округляет ставки и не делает различий между похожими карточными комбинациями, например флэшем с королем во главе и флэшем, где старшая карта — дама. После создания абстракции, компьютер разрабатывает плановую стратегию поведения для первых кругов, а также очень приблизительную стратегию для следующих этапов.
Чтобы научиться делать это, Libratus играл против самого себя, используя измененную версию алгоритма Monte Carlo Counter-factual Regret Minimization (MCCFR). С его помощью для каждого действия вычислялось значение сожаления — то, насколько игрок сожалеет о том, что он не сделал определенный шаг в прошлом. Во время симуляции MCCFR выбирал «исследователя», который должен был анализировать все возможные действия и постоянно обновлять значение сожаления. При этом его противник играл согласно стратегии, которая выстаивается на основе уже имеющихся данных. В конце «исследователю» давалась награда за каждое действие, благодаря которой он понимал, какой ход был хорошим, а какой — нет. После каждой партии игроки менялись ролями. В классическом варианте компьютер обычно исследует все гипотетические действия, чтобы выяснить размер награды за них; здесь же он пропускал «неинтересные» ходы, которые имели низкое значение сожаления, что позволило быстрее усовершенствовать его работу.
Для следующих этапов игры использовался второй модуль Libratus. Он создавал детальную стратегию для конкретного этапа игры, руководствуясь при этом плановой стратегией, разработанной в начале. Каждый раз, когда противник совершал не предусмотренное системой ИИ действие, она разыгрывала «мини-игру», где учитывался ход соперника. Это позволяло корректировать стратегию в режиме реального времени.
Третья часть Libratus улучшала исходную стратегию алгоритма. Обычно для этого строится модель поведения противника, которая учитывает его возможные ошибки. Однако Браун и Сандхолм использовали данные о ставках. Днем компьютер следил, какие ставки чаще всего делают другие игроки, а ночью вычислял возможные варианты развития событий с учетом этих данных.
Авторы статьи считают, что у систем, подобных Libratus, большое будущее в самых разных сферах, где приходится иметь дело с неполной информацией. Они могут быть использованы в сфере информационной безопасности, в военном деле, аукционах, переговорах и даже при распределении медикаментов.
Значимая победа компьютера над профессиональными игроками в игре с полной информацией произошла в 2015 году: тогда программа AlphaGo обыграла Фаня Хуэя в го — настольной игре, где противники стремятся огородить наибольшую территорию на игровой доске с помощью камней черного или белого цвета. А уже в 2017 году усовершенствованная версия AlphaGo победила другого известного игрока, Ли Седоля, которого относят к сильнейшим в мире. Теперь AlphaGo Zero научилась играть и в другие настольные игры.
-
Автор: GlavFish
Сбербанк организовал хакатон, в котором специалисты по машинному обучению смогут создать игровой искусственный интеллект, способный играть в покер, говорится на странице конкурса. Призовой фонд конкурса составит 600 тысяч рублей.
Участники должны будут написать бот для игры Texas Hold’em Poker, который будет соревноваться в турнирах с 8 ботами конкурентов. Программа должна в режиме реального времени принимать решения и совершать действия, направленные на победу. Результаты игр будут появляться на сайте хакатона, что позволит участникам обучать ботов и анализировать стратегии других игроков.
Хакатон разделен на два этапа: онлайн и офлайн. С 30 августа разработчики смогут отправлять решения организаторам. Эта часть соревнования завершится 15 сентября в 23.59 по московскому времени, после чего Сбербанк составит рейтинг участников и выберет 100 финалистов, которые примут участие в офлайн-хакатоне. Вторая часть мероприятия, в ходе которой финалисты смогут доработать алгоритмы в командах, начнется 23 сентября в Корпоративном университете Сбербанка (находится в Московской области), а победителей наградят 24 сентября.
Победителю хакатона выплатят 300 тысяч рублей, обладателю второго места — 200 тысяч, а бронзовому призеру соревнований достанется 100 тысяч рублей.
"Искусственный интеллект сегодня должен служить не только для разработки рациональных алгоритмов, но и для моделирования нерационального поведения участников рынка или, как в случае с нашим турниром, игроков в покер", - Александр Ведяхин, старший вице-президент Сбербанка.
Информация о формате отправки архивов с кодом стратегии будет доступна 1 сентября. Турниры между отправленными в систему ботами будут проходить ежедневно в полночь по московскому времени. В ходе онлайн-этапа разработчики смогут загружать решения не более 5 раз в течение одних суток, однако организаторы будут учитывать только последнее решение.
-