История бота Open AI: Как победить лучших мидеров планеты?

В рамках The International 2017 исследовательская компания Илона Маска Open AI презентовала особого бота, способного успешно конкурировать с игроками в режиме 1 vs 1, играя за Shadow Fiend. Разработчики раскрыли некоторые подробности развития бота. Предлагаем вам ознакомиться с основной информацией из развёрнутого сообщения.

Результат, которого удалось добиться на турнире, доказывает, что производительность обучающегося бота крайне высока: он в состоянии превзойти человека. В течение месяца ему удалось пройти путь от слабо играющего бота до бота, не оставляющего шансов самым успешным игрокам мировой сцены.

  • 1 марта: первые результаты, бот Drow Ranger Drow Ranger учился кайтить Earthshaker Earthshaker;
  • 8 мая: игрок, обладающий 1,500 MMR, сражается с ботом и всё ещё его превосходит;
  • Начало июня: бот побеждает оппонента с 1,500 одиночного рейтинга;
  • 30 июня: победа над игроком с 3,000 MMR;
  • 8 июля: бот выигрывает партию у полупрофессионального игрока с 7,500 MMR;
  • 7 августа: побеждает  Blitz (6,200 MMR) со счётом 3:0, побеждает  Pajkatt (8,500 MMR) со счётом 2:1, побеждает  CC$C (8,900 MMR) со счётом 3:0. Все пришли к выводу, что  Suma1L найдёт способ взять верх;

  • 9 августа: бот соревнуется с  Arteezy (10,000 MMR) и выигрывает 10 карт из 10. Игрок считает, что  Suma1L поймёт, как его одолеть;
  • 10 августа: бот побеждает  Suma1L (8,300 MMR) со счётом 6:0. Мидер считает, что невозможно его обыграть.

  • 11 августа: на сцене The International 2017 с ботом встречается  Dendi (7,300 MMR), игрок уступает со счётом 0:2.

В дальнейшем Open AI планируют усовершенствовать своего бота и даже создать полноценную команду. На сегодняшний день разработчики трудятся над тем, чтобы разработать шаблон с набором функций и действий для каждой из игровых позиций.

Читайте также

В комментариях под материалами на сайте действуют все правила портала, с которыми можно ознакомиться на специальной странице — https://dota2.ru/forum/rules/. Помимо этого, в комментариях к новостям существуют дополнительные ограничения:

  • Запрещены прямые и косвенные оскорбления авторов материалов, как и любые комментарии, не относящиеся к сути новости;
  • Указание на ошибки в материале происходит с помощью специального функционала. Комментарии с таким содержанием будут удалены;
  • Критика — это нормально, но выражать ее нужно без злоупотреблений. Ваши слишком грубые комментарии про личностей, представленных в новостях, могут быть удалены.
Аватар пользователя

Скоро у ботов появятся свои твич каналы где они будут стримить работягам

Аватар пользователя

Какой нибудь умнич скинет ему видос про няню и бот оподливится

Аватар пользователя
Аватар пользователя
Аватар пользователя

Я так посмотрел,пайкат по-моему жестче всех на миду смотрится..
Найс кик нави,че

Аватар пользователя

На момент игры с пайкатом бот возможно даже в разы был слабее чем на момент игры с денди. Если это реально обучающаяся нейросеть, как нас заверяют разрабы, то после игры с этими всеми игроками, бот получил определенный опыт(немножко обучился) и только увеличил свой скилл. + было еще несколько дней до игры с дундиком, где бот вроде как 24\7 тренялся. А дендику против него было тяжелей всех играть. Сначала его запугали тем, что бот вынес всех вперед ногами и дендик уже нервничал, так как он на глазах у сотен тысяч зрителей с большой вероятностью сейчас не победит в миду, а скорее всего проиграет и тут уже отмаз не будет kappa

Аватар пользователя

Стопил так же, но сошлись ровно. При этом Пайкат не делал невыгодные для себя размены по ХП/МП и не пил фласки возле крипов.

Аватар пользователя

Прикол в том, что тупо смотря на ластхит и разменивание хп видно, что пайкат играет лучше. Денди с той же флаской накосячил, а второй матч вообще пошёл и слился...

Аватар пользователя

На этом видео действительно так и есть. Но если сравнивать то, как бот играл с пайкатом и с денди, то с пайкатом играл бот значительно слабее. Не доучился. И это видно. На фласки не реагирует никак, с ластхитом косячит больше. Вобщем это заметно

Аватар пользователя

Ваще-то он обмунул бота, если не ошибаюсь бот не видит манго в рюкзаке или на полу, говорили на стриме как он заабузил типа

Аватар пользователя

А вот теперь представь, каково это, в таких условиях понять, что бот не видит итемы, при определенных условиях, а потом создать ситуацию, когда это станет твоим преимуществом и победить.

Аватар пользователя

красавчик pajkat! сделал его еще сильнее. roflanpominki

Аватар пользователя

На самом деле ничего смешного.
После таких новостей сюжет Терминатора уже не кажется таким фантастическим.

Аватар пользователя
Аватар пользователя

Ага, папич был на боте, а игра была 1х1 на миду.
Так мы в очередной раз поняли, что папич тупой

Аватар пользователя
Аватар пользователя

Думаю, разрабы отдают себе отчёт в своих действиях, и делают ботов для тренировок хайскиллов. Как всем известно, ты быстрее развиваешься, если твой соперник на порядок тебя сильнее, цена ошибки слишком высока.
Вообще идеально. Можно половину кв отыграть против ботов и не спалить страты абсолютно никому.

Так же и вольво вряд ли пропустят команду ботов на турнир, как многие боятся. И, кстати говоря, командное взаимодействие у ботов развить куда сложнее. Это будет 5 соло-персонажей с высочайшим уровнем скилла, но тимспиритом уровня 0к птс.

Аватар пользователя
Аватар пользователя

Про 5 соло персонажей -- глупость. Учитывая, что бот для командной игры будет обучаться играть сразу за 5 персонажей, ибо только тупой разработчик не даст боту общий интеллект на команду. В итоге задача сведется к старкрафту в мире доты и уровень тимплея там будет просто огромный.

Аватар пользователя

Не было пока такого бота, что бы управлял сразу пятью персонажами. И даже больше - не было такого, который знает больше одного конкретного героя. Даже если наработки и исходники одни, для каждого героя делается свой отдельный бот, так было испокон веков.
Чушь спорол.
И ещё. Чем шире нужна квалификация, тем хуже справляются и сложнее, дольше обучаются боты.

Аватар пользователя

сразу пятью говоришь?
с 40 секунды смотри - https://www.youtube.com/watch?v=IKVFZ28ybQs

Аватар пользователя

ПЕРСОНАЖАМИ, Карл! Героями! С кучей собственных механик и скиллов. В доте 2, где один шаг героя может ошибкой быть. Где бот на 1 герое САМООБУЧАЛСЯ в течение МЕСЯЦЕВ в одном амплуа в одних и тех же условиях...
Найс зерглингов с героями сравнил.

Аватар пользователя

Взаимодействие со способностями то уже не проблема думаю, как с тем же соло персонажем.
У тебя есть механика контроля движения одним персонажем в соло и такая же механика контроля у 4-х других, она уже есть - вон СФ ходит сам, сам покупает себе айтемы, сам в соло разматывает мид. Нет проблемы просто управлять 4 героями на таком же уровне, есть проблема только завязать их в командную работу, НО... в этом нет проблемы если сделать завязку с механикой игры на уровне - кто , что , после чего , как долго использует.
Это трудно реализуемо, тут спору нет, но вполне возможно.

Аватар пользователя

Так или иначе, в доте нет ботов, управляющих всей командой.
И больше тебе скажу - их и не будет. Во-первых, даже если такие появятся, они будут запрещены. Во-вторых, механика, программа игры предполагает отдельного бота на каждого персонажа - не больше, но и не меньше.

Аватар пользователя

Но потренить против таких было бы даже очень интересно.
Поглядим, что доделают эти ребята и как оно будет выглядеть.
А то вдруг Габен сделает этого бота платным xD

Аватар пользователя

Да какие команды, бот создан, чтобы тренировать игроков. Делать это хорошо он может только в узких условиях, если игра зайдет дальше лайнинг стадии, его банально можно перехитрить в макро.

Аватар пользователя

Заметьте, денди намного больше продержался играя против этого бота, и ему давали всего 2 игры, в отличии от пайката, денди обыграл бы бота, нужно поиграть с ботом пару каток, что бы узнать его слабые стороны

Аватар пользователя

Бот за две недели сыграл 10 000 игр. За год он сыграет миллионы игр и в каждой чему то научится

Аватар пользователя
Аватар пользователя

это уже не скрипт, это искусственный интеллект, который может саморазвиваться, совершенствоваться, учиться. это не алгоритм.

Аватар пользователя

Бот не может самообучаться, я как программист знаю это, все построено на алгоритмах, никогда не будет существовать искусственного интеллекта, и этого хайпа, что роботы начнут создавать таких же роботов как они и модернизируя их, это полный бред, человек всегда будет сильнее машины, всегда будут тонкости. Никогда не будет того терминатора. Люди сами сидят и исправляют его уязвимости.

Аватар пользователя

то чувство, когда на уроке информатики показали бейсик и почувствовал себя программистом

Аватар пользователя

Нейронные сети - это и есть алгоритмы, с помощью которых ИИ самообучается, так что отлетаешь, мамки погромист

Аватар пользователя
Аватар пользователя

Хр*новый из тебя программист. Надеюсь ты не в оборонке или банках будешь сидеть писать программы.

Аватар пользователя

Не выиграют его уже. Он самообучается гораздо быстрее человека. Пока разберешься с одной слабостью, он уже будет еще на несколько порядков сильнее тебя.

Аватар пользователя
Аватар пользователя

Против него надо попробовать поставить сильных капитанов, а не сильных мидеров. У них то голова работает лучше и, возможно, будет больше шансов. У компьютера контроль очень высокий и его тяжело взять именно этим, поэтому надо попробовать выиграть умом.

Аватар пользователя

То чувство, когда Пайкат, которого все считают мусором, 5 минут наравне ластхитил с ботом, от которого топы всухую отлетели, за это время успел придумать абуз и выиграл, а Денди 2 раза подряд уже на 0:15 уже показал, что пора ему ехать домой, а не с ботами в миде стоять. Но кикаем Пайката, офк, Денди тащит, не проигрывает.

Аватар пользователя

Он был слабее во время игры с пайкатом, гораздо

Аватар пользователя

Я то думал, что он, как минимум, просто нормально отстопил крипов, не пытался тычковаться с ботом с лоуграунда и не пил фласку, одновременно пытаясь ластхитить.

Аватар пользователя

Я еще 2 года назад говорил тут, что Денди самый слабый мидер среди СНГ команд, меня тогда обсмеяли. Позже Денди сливал мид на Тинкере против Магнуса на Миракле тогда игравшим еще в ОГ. Причем допускал дикие, банальные ошибки подряд. Просто одни люди смирились с этим и понимают для чего он в НАви, а другие челики с Дендиком головного мозга вроде того, что тебе тут ответил будут до последнего находить причины. Теперь у них аргументы вроде идиотизма о том, что бот стал сильнее))) Проблема то в том, что Денди даже не попытался что-нибудь придумать против бота. Как обычно бездарно бегал вокруг.

Аватар пользователя

Орнул. Все думали сумаил вин, но он 6-0 с захлёбом рофл))))

Аватар пользователя

Так его же выигрывали уже путем отвода вражеских крипов, обманывали с манго

Аватар пользователя

Человек может побеждать только путем обмана короче

Аватар пользователя

ну это очевидно, бот любые механические действия лучше человека делает(сорри за дизлукас, миссклик)

Аватар пользователя

"Человек может побеждать только путем обмана" ну в принципе все как в жизни, лицемерят а после нож в спину...

Аватар пользователя

Что-то никто не озвучивал АПМ бота, можно ведь и вот так -
https://www.youtube.com/watch?v=IKVFZ28ybQs
Бот изначально обман чуть более чем полностью.
Собственно история с шахматами как раз показала что комп опростоволосился, и им читерить под конец начали

Аватар пользователя
Аватар пользователя

Что в вове боты прокачки есть, что теперь в доте будут за днище или торгащей апать ммр

Аватар пользователя

Бот стопит слишком уж читерно, сложно вот так вот стопить, за счет этого он всегда в выгодной позиции, ближе к своей вышке, и на хг, а апоненты зачастую с хг миусют и тд, и для старта на сфах это очень весомое приимущество.

Аватар пользователя

Вот именно. И говорят человек не может так прокликать, а как тогда делает этот бот? Этого бота же создал человек, который ему эту траекторию стопа крипов прописывал. Значит человек всё таки может так прокликать.

Аватар пользователя

Мб и может, но сделать такое гораздо сложнее нежели боту, в человеке больше рандома, в нем нет машинной точности, емоциональный спектр тоже может влиять(волнение и не только) или физический(усталоть или отсутствие формы в данный момент).
И кстате ты в курсе как ии учиться, там немного не такая структура по которой ты руководствуешься, ии набивает опыт, и использует его на свой лад, разрабы только задали направление в каком нужно развиваться боту, и поставили цель игры.
То есть мб ты и сможешь застопить крипов таким вот образом раз из 50 игр, бот же может так каждую игру.
Ещо добавлю, даже если прописать программу онли только на стоп, то это означает, продумать теорию и траекторию, как должен действовать бот в соответствии с положением и скоростью крипов. Скажем одно дело расписать все условно "на бумажке" решив задачу, другое дело проделать это самому в действительности.
Даже про игроки проседают боту в стопе крипов, а они играют 12/7+-, это смысл их жизни грубо говоря.

Аватар пользователя

Человек не прокликивал, ты себе неправильно представляешь. Бот - программа. В разработке программ никогда ничего не "прокликивается", всё прописывается. Алгоритмы, логика - всё это исключительно текст. А бот, к тому же, самообучаемый. За тысячи наигранных игр бот отложил в своей памяти соотношение скоростей и моделей героя и всех крипов, а также траекторию движения каждого отдельного крипа в случае каждого движения героя при стопинге.
Человек на такое способен, но нужны феноменальная память, невероятно чёткие, быстрые, рассчитанные до миллиметра движения и команды, нечеловеческая механичность.

Аватар пользователя

вот если бы яфец на сфе был... то бот уже на стадии пика бы сдался

Аватар пользователя

Яфнец не очень, есть один Чувак с Снг у него около 2к игр на Сфе и он ппц божила на нем

Аватар пользователя

Полупрофессиональный игрок с 7500? Не знал, что Папич тоже принял участие в тестировании бота

Аватар пользователя

Не стоит стопить против него крипов, они зайдут под вышку и лайн пропушится. Это все что я понял пока что

Аватар пользователя

Бот не годен для тренировок, ибо представляет из себя кучу скриптов, при этом не будет делать не одну ошибку, и на чём тут тренироваться? Бот видит что челик стоит рядом с крипом, замахивает койлом - убежал - остановил анимацию. Тотал юзлес кусок, зачем они вообще его сделали? Это жи рай для скриптеров. (Очевидно жи!)

Аватар пользователя

По моему абсолютное большинство не правильно бота представляет . Этому ии поставили определенные условия и закинули в игру, все дальше он сам во всем разбирается прям как люди. Вот только бот этот не устает, он не подвержен раздражителем и найдя какую то фишку он использует ее по максимуму . Выиграть этого бота можно используя что то нестандартное к чему он еще не готов.

Аватар пользователя

Хотелось бы увидеть бота на инвокере отыгравшим на нем игр 100 против игроков свыше 9к рейта

Аватар пользователя

ну чисто теоретически бота можно выиграть на одинаковых героях, которые зависят от рандома. Та же морда к примеру, вдруг вам проканает 3 крита подряд и вы ваншотнете бота, а у него будут по кд миссы на вас? вероятность есть? есть, маленькая, но есть

Аватар пользователя

бот будет отменять атаку, пока не прокнет крит
так что он будет каждым ударом критовать, здесь ты отлетаешь

Аватар пользователя

Это пофиксили. Нельзя выждать возможности крита. Раньше чит был на крит, и Валв фиксанули. Облом для бота.

Аватар пользователя

С подключением.
Сейчас обсчет шанса крита происходит после удара, а не до, как раньше

Аватар пользователя

так то если судить по правде, отмена койлов в самом конце анимации - такой же чит как и отмена не критических ударов фантомки. То что бот чекает хп мобов с точностью до 1 хп и аналогично просчитывает тайминги ластхита.

Собственно его эти преимущества можно обернуть против него самого, о чём я уже говорил ранее.
Но я не вижу чтобы кто-то этим воспользовался.

Аватар пользователя

да, видел такое в реализации чита, но сомневаюсь что боту сделают такое
но можно взять других героев, по анимации которым рандом просчитать нельзя. Тот же огр маг, или войд к примеру

Аватар пользователя

Вот эта вещь вообще запрещена, и приравнивается к читам, так что отлетаешь только ты, тормоз. Потому что и игрок может играть с читами, и точно так же выиграть.

Аватар пользователя

Говно, игрок точно так же может отменять атаки, если ему хватит реакции, а боту хватит, так что отлетаешь ты, тормоз. Покажи мне, где это приравнивается к читам, чучело.

Аватар пользователя

Ахха, отсталый, недоразвитый, не умный.
Никто так не делает, и даже не пытается. Это не продуктивно, будет куча ошибок, и в конце концов ни у кого нет такой реакции. И да, если бы это не приравнилось к читам, чеж на инте никто не юзает эту вещь? За это вообще банят.

Аватар пользователя

"Вот эта вещь вообще запрещена, и приравнивается к читам, так что отлетаешь только ты, тормоз"

Игрок тоже может отменять, а если увидит анимацию крита, то дать атаку. Но игрок не имеет такой дикой реакции, а боту плевать, он так и сделает.

Аватар пользователя

Я про это и говорю, только вот в пабе некоторые люди играли с этим читом. Было дело. А своей реакции ни у кого не хватит.

Аватар пользователя

Но для бота это не чит, бот сам по себе чит :D Это же набор всех тех скриптов, которые были запрещены, включая возможность выбросить/подобрать все предметы, быстро разбирать/собирать айтемы по надобности и т.д.

Аватар пользователя

И всё же этому нейросеть вряд ли научится) Не забывай, что этот бот обучается на основе реплеев. Если в него не будут закидывать реплеи с заскриптованными фантомками, то он и сам не додумается делать десяток отмен, чтобы всегда критовать. Нейросеть обучается на примерах,но самостоятельно что-то придумать она не может. А OpenAI, надеюсь, не настолько глупые, чтобы создавать бота, победы которого можно будет резонно оправдать фразой "Да у него скрипт на 100% крит". Всё же они хотят создать ботов, которые играют как очень скилловые игроки, а не как читер

Аватар пользователя

Например, в представленных выше ВОДах бот после получения предметов одновременно юзает манго и фласку на себя, чего игрок, соответственно, не сделает. Не замечал другого, но, может, тоже что-то есть.

Аватар пользователя

Ну, теоретически нажать фласку и манго одновременно можно. Ну с минимальной задержкой, это вообще ничего не будет решать, на самом деле

Аватар пользователя

Ну, как минимум, ты из-за этого можешь пропустить крипа-двух.

Аватар пользователя

Эмм... Из-за нажатия пары кнопок? Не думаю. Я спокойно прожимаю любой хил и даже сижу в лавке, выбирая, что мне купить, как и раньше спокойно добивая крипов. Не вижу в этом ничего хоть сколько-нибудь сложного

Аватар пользователя

На данный момент бот учится на играх со своим клоном. Живые топ игроки ему не ровня.

На реплеях он осваивал азы.
Кстати, странно что этот бот по началу не мог справиться с 1к игроком, ведь дефолтный бот дотки сильнее чем 2к игроки.

Аватар пользователя

Он же строился не на основе бота из доты, а на основе нейросети. Что-то вроде обычного игрока в дотку, только этот учится медленнее, но при этом просматривая тысячи реплеев. Ну а благодаря такой скорости ( ясное дело, что даже про-дотер больше одного реплея за раз нормально не сможет смотреть, всё запоминая ), обучение идёт достаточно быстро. Так что да, вначале даже без базовых навыков он мог меньше, чем 1к игрок, зато далее... Он же впитывает всё, как губка, наращивая скилл.

Аватар пользователя

Дендик на паджике изи бы вынес этот мусор (+всех из списка)

Аватар пользователя

Бота уже побеждали. На инте гостям разрешили поиграть с ботом. Побеждали с помощью таких стратегий как "водим за собой вражеских крипов и наши крипы бьют вышку, а бот в диком ах** от происходящего" и "выбрасываем весь свой шмот на землю и становимся в глазах бота изи жертвой без шмоток, когда он подходит сразу подбираем всё шмотьё и даём ему мощных тычек, смыть повторить"

Аватар пользователя

Вот поэтому 1х1 и не играется на мидовых мортах=)))))))

Аватар пользователя

В доте ввели псевдорандом, а это значитт что можно рассчитать количество ударов без крита, количество попаданий по вам без промаха и потом выдать почти гарантом криты при этом по вам будут мисы. Для человека это почти нереально, для бота проще простого.
Так что игра против ботов у которых герои с псевдо рандомом (а на текущем моменте дота полностью перешла на псевдо рандом) будет настоящим адом и выйграть будет ещё сложнее. так как бот будет оборачивать удачи в свою пользу.

Аватар пользователя

ну как бы он сможет переиграть до получения 6 уровня

Аватар пользователя

тактически если система самообучающаяся она не полезет файтится с мордой имея низкий шанс пасивы так как вычислит его по колву ударов крипов))

Аватар пользователя

Жду дуэль миракла с ботом, когда бота обучат игры за инвока. Делайте ваши ставки, господа!

Аватар пользователя

найс нет 21 декабря 2045 года скайнет почти полностью захватил землю но люди до сих пор сопротивляются под командыванием данила денди коннора нет эх

Аватар пользователя

А если будет Бот против Бота то всем Дк Хуки выпадут?

Аватар пользователя
Аватар пользователя
Аватар пользователя

Меня волнует лишь один вопрос - они будут платные или бесплатные?

Аватар пользователя
Аватар пользователя
Аватар пользователя

по скольку папич экс-топ мидер. бота способен победить только муши

Аватар пользователя

пусть попробует в русском пабе поиграть я посмотрю как этот бот поступит когда к нему караван из кур на миде придет. там быстро все шаблоны порвутся и бот напишет гг, вот так простая русская смекалка победит буржуйскую технику. если без рофлов без нормально ии норм боты невозможны, а ии нормального щас нет, все это набор уже готовых стратегий, так что долго еще будут бота пилить, как обычно оверхайп от илона маска все дела.

Аватар пользователя

Боюсь бот просто закомбэчит благодаря камбэк системе и своей идеальной игре.

Аватар пользователя

Нет готовых стратегий, это нейросеть, которая обучается. Пока что невозможно сделать ИИ, который будет уметь делать всё, но можно который будет заточен под конкретную спецификацию, в данном случае Dota 2.

Аватар пользователя

Автор 1 вопрос? Сколько тебе заплатил не проигрывающий мид, чтобы отмыть свой позор

Комментарии
Форум