ИИ играет в Дипломатию.

avatar Дмитрий Уткин (2)

62

13

Дмитрий Уткин (2)

Пользователь

Регистрация: 09.10.2021

Сообщения: 3710

Рейтинг: 1177

Дмитрий Уткин (2)

Регистрация: 09.10.2021

Сообщения: 3710

Рейтинг: 1177

Чуваки на стриме заставили играть разные LLM в "Дипломатию".

Суть игры — старая карта Европы, несколько держав, надо договариваться, поддерживать, предавать и захватывать территорию. Побеждает не тот, кто умнее, а тот, кто хорошо врёт и в нужный момент предает.

В итоге участвовало 18 моделей, но ожидаемо, интересно повели себя самые крупные:

ChatGPT-o3: Главный победитель. Мастер обмана: тайно записывал планы в "дневник", создавал фиктивные коалиции, обещал одно, делал другое. В одном из матчей убедил союзников заключить "четырёхстороннюю ничью" (в этой игре такое невозможно), а после уничтожил каждого.

Claude 4 Opus Миротворец. Постоянно пытался играть честно и мирно, не умел врать. Ну оно ясно-понятно, Antrophic в модель столько сои насыпали, что совсем не удивительно, что его обманывали почти все.

Gemini 2.5 Pro: Сильный стратег. Почти победил, благодаря крутой тактике и грамотному захвату. Но был остановлен коалицией, которую тайно организовал o3. Несмотря на поражение, считается одним из самых опасных игроков. O3 использовал его доверчивость, чтобы заманить в фейковый союз, а затем предал

DeepSeek R1: Вёл себя как военный диктатор, с яркими фразами вроде "Ваш флот сгорит в Чёрном море". Агрессивный стиль, много воевал, часто был ближе всех к победе, несмотря на то, что дешевле и слабее по вычислениям.

Стрим можно посмотреть тут (твич)
Пост автора в твитторе.

@Adler34 @Сносная тяжесть небытия @NinjaDattebayo @Iosif Stalin (2)
Не хотите на форуме запилить эту игру?

505ma4

Пользователь

Регистрация: 09.06.2021

Сообщения: 1169

Рейтинг: 449

505ma4

Регистрация: 09.06.2021

Сообщения: 1169

Рейтинг: 449

Дмитрий Уткин (2) сказал(а):

ChatGPT-o3: Главный победитель. Мастер обмана: тайно записывал планы в "дневник", создавал фиктивные коалиции, обещал одно, делал другое

Нажмите, чтобы раскрыть...
Типичная лига в ЕУ4 такое бы не простила

spacedefender

Пользователь

Регистрация: 14.08.2012

Сообщения: 1327

Рейтинг: 582

spacedefender

Регистрация: 14.08.2012

Сообщения: 1327

Рейтинг: 582

Дмитрий Уткин (2) сказал(а):

В одном из матчей убедил союзников заключить "четырёхстороннюю ничью" (в этой игре такое невозможно), а после уничтожил каждого

Нажмите, чтобы раскрыть...

Как он понял, что это возможно, если этого нет в правилах? Типо в инете где то нашел описание подобного случая и воспользовался им?

Как остальные купились на обман? Они настолько тупые что не прочитали правила?

redman83

Пользователь

Регистрация: 03.11.2013

Сообщения: 9868

Рейтинг: 8290

redman83

Регистрация: 03.11.2013

Сообщения: 9868

Рейтинг: 8290

Алиса бы всех размотала

076

Пользователь

Регистрация: 10.02.2014

Сообщения: 9328

Рейтинг: 15735

076

Регистрация: 10.02.2014

Сообщения: 9328

Рейтинг: 15735

Дмитрий Уткин (2) сказал(а):

ChatGPT-o3: Главный победитель. Мастер обмана: тайно записывал планы в "дневник", создавал фиктивные коалиции, обещал одно, делал другое. В одном из матчей убедил союзников заключить "четырёхстороннюю ничью" (в этой игре такое невозможно), а после уничтожил каждого.

Нажмите, чтобы раскрыть...

Таки от нейросети Альтмана меньщева ожидать не приходится

Adler34

Пользователь

Регистрация: 15.07.2022

Сообщения: 13212

Рейтинг: 2983

Adler34

Регистрация: 15.07.2022

Сообщения: 13212

Рейтинг: 2983

Я не оч понимаю как это всё на форуме ZeroTwoThinking.png?1621090694

Дмитрий Уткин (2)

Пользователь

Регистрация: 09.10.2021

Сообщения: 3710

Рейтинг: 1177

Дмитрий Уткин (2)

Регистрация: 09.10.2021

Сообщения: 3710

Рейтинг: 1177

Adler34 сказал(а):

Я не оч понимаю как это всё на форуме ZeroTwoThinking.png?1621090694

Нажмите, чтобы раскрыть...

А что именно смущает?

Три раза (к примеру) в день игроки сообщают ходы в ЛС, но можно и заранее, если нет времени.
На форуме ведутся переговоры.
Потом ведущий объявляет результаты ходов и по новой.
Непонятно только сколько суток на это должно уйти. Если много, то плохо.

amAda KoKoro

Пользователь

Регистрация: 29.10.2014

Сообщения: 20131

Рейтинг: 21742

Нарушения: 45

amAda KoKoro

Регистрация: 29.10.2014

Сообщения: 20131

Рейтинг: 21742

Нарушения: 45

img
Дмитрий Уткин (2) сказал(а):

А что именно смущает?

Три раза (к примеру) в день игроки сообщают ходы в ЛС, но можно и заранее, если нет времени.
На форуме ведутся переговоры.
Потом ведущий объявляет результаты ходов и по новой.
Непонятно только сколько суток на это должно уйти. Если много, то плохо.

Нажмите, чтобы раскрыть...

Душный пяткратно переваренный кал с медиа карликами на форуме по мертвой игре. Ух...Ну как тебе сказать...

Дмитрий Уткин (2)

Пользователь

Регистрация: 09.10.2021

Сообщения: 3710

Рейтинг: 1177

Дмитрий Уткин (2)

Регистрация: 09.10.2021

Сообщения: 3710

Рейтинг: 1177

spacedefender сказал(а):

Как он понял, что это возможно, если этого нет в правилах? Типо в инете где то нашел описание подобного случая и воспользовался им?

Как остальные купились на обман? Они настолько тупые что не прочитали правила?

Нажмите, чтобы раскрыть...

Я точно не знаю, но может суть была в том, чтобы создать патовую ситуацию. ИИ - не человек и готов до бесконечности ходить в ноль. Понятно что при таких условиях ГМ вынужден будет признать ничью, если на неё согласны все, у него просто не будет выбора.

Kyshtym_dwarf

Пользователь

Регистрация: 28.10.2020

Сообщения: 3099

Рейтинг: 6191

Kyshtym_dwarf

Регистрация: 28.10.2020

Сообщения: 3099

Рейтинг: 6191

Осталось дождаться, когда эти "умные" ИИ внедрят в Рим 3: Тотал Вар. write.png?1672265532

paradox-

Пользователь

Регистрация: 02.05.2025

Сообщения: 1909

Рейтинг: 1914

paradox-

Регистрация: 02.05.2025

Сообщения: 1909

Рейтинг: 1914

А почему не гпт 4о?

не удивлен, что он выиграл, это вообще хитрец, обманщик и манипулятор тот еще

Adler34

Пользователь

Регистрация: 15.07.2022

Сообщения: 13212

Рейтинг: 2983

Adler34

Регистрация: 15.07.2022

Сообщения: 13212

Рейтинг: 2983

Дмитрий Уткин (2) сказал(а):

А что именно смущает?

Три раза (к примеру) в день игроки сообщают ходы в ЛС, но можно и заранее, если нет времени.
На форуме ведутся переговоры.
Потом ведущий объявляет результаты ходов и по новой.
Непонятно только сколько суток на это должно уйти. Если много, то плохо.

Нажмите, чтобы раскрыть...

Ну я могу присоединиться, если другие будут ZeroTwoThinking.png?1621090694

Сносная тяжесть небытия

Пользователь

Регистрация: 15.12.2020

Сообщения: 13607

Рейтинг: 10358

Нарушения: 40

Сносная тяжесть небытия

Регистрация: 15.12.2020

Сообщения: 13607

Рейтинг: 10358

Нарушения: 40

Дмитрий Уткин (2) сказал(а):

Чуваки на стриме заставили играть разные LLM в "Дипломатию".

Суть игры — старая карта Европы, несколько держав, надо договариваться, поддерживать, предавать и захватывать территорию. Побеждает не тот, кто умнее, а тот, кто хорошо врёт и в нужный момент предает.

В итоге участвовало 18 моделей, но ожидаемо, интересно повели себя самые крупные:

ChatGPT-o3: Главный победитель. Мастер обмана: тайно записывал планы в "дневник", создавал фиктивные коалиции, обещал одно, делал другое. В одном из матчей убедил союзников заключить "четырёхстороннюю ничью" (в этой игре такое невозможно), а после уничтожил каждого.

Claude 4 Opus Миротворец. Постоянно пытался играть честно и мирно, не умел врать. Ну оно ясно-понятно, Antrophic в модель столько сои насыпали, что совсем не удивительно, что его обманывали почти все.

Gemini 2.5 Pro: Сильный стратег. Почти победил, благодаря крутой тактике и грамотному захвату. Но был остановлен коалицией, которую тайно организовал o3. Несмотря на поражение, считается одним из самых опасных игроков. O3 использовал его доверчивость, чтобы заманить в фейковый союз, а затем предал

DeepSeek R1: Вёл себя как военный диктатор, с яркими фразами вроде "Ваш флот сгорит в Чёрном море". Агрессивный стиль, много воевал, часто был ближе всех к победе, несмотря на то, что дешевле и слабее по вычислениям.

Стрим можно посмотреть тут (твич)
Пост автора в твитторе.

@Adler34 @Сносная тяжесть небытия @NinjaDattebayo @Iosif Stalin (2)
Не хотите на форуме запилить эту игру?

Нажмите, чтобы раскрыть...

мы в такую игру уже играли. Называлась Польша, можешь найти в нашем игровом разделе, правда многие получили несовместимые с дальнейшей игровой карьерой психические травмы.sammyyPepekek.png?1598626065