Anthropic выпустила Claude Sonnet 3.5. Лучше GPT4o?

avatar StoP.IT.FroZzz...

20

11

StoP.IT.FroZzz...

Пользователь

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

StoP.IT.FroZzz...

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

Собственно вот новость с их сайта:

https://www.anthropic.com/news/claude-3-5-sonnet

Они утверждают, что эта модель лучше GPT4o в бенчмарках, но что-то я сомневаюсь в этом. Фришная версия с лимитами есть.

Ещё не клацал.

Just_a_Noname

Пользователь

Регистрация: 04.09.2013

Сообщения: 14652

Рейтинг: 11722

Just_a_Noname

Регистрация: 04.09.2013

Сообщения: 14652

Рейтинг: 11722

img

Давайте дальше, больше. Интересно что через 3-4 года вообще будет

StoP.IT.FroZzz...

Пользователь

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

StoP.IT.FroZzz...

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

Just_a_Noname сказал(а):

Давайте дальше, больше. Интересно что через 3-4 года вообще будет

Нажмите, чтобы раскрыть...

Да похоже на гонку, где каждая новая модель на пару-тройку процентов лучше предыдущей. Думаю будут двигаться в направлении удешевления цены дальше.


Без комментариев:

chatgpt4o
Клод 3.5 соннет

мультифрукт

Пользователь

Регистрация: 23.07.2023

Сообщения: 2191

Рейтинг: 2109

мультифрукт

Регистрация: 23.07.2023

Сообщения: 2191

Рейтинг: 2109

StoP.IT.FroZzz... сказал(а):

Да похоже на гонку, где каждая новая модель на пару-тройку процентов лучше предыдущей. Думаю будут двигаться в направлении удешевления цены дальше.


Без комментариев:

chatgpt4o
Клод 3.5 соннет
Нажмите, чтобы раскрыть...

Обе нейросети советуют Шейкера на четвёрку... Жуткое говноедство, равносильно случаю, как нейросеть посоветовала челу в качестве заправки для салата сделать инкубатор ботулотоксина) А так у Claude советы получше и полнее, имхо.

StoP.IT.FroZzz...

Пользователь

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

StoP.IT.FroZzz...

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

мультифрукт сказал(а):

Обе нейросети советуют Шейкера на четвёрку... Жуткое говноедство, равносильно случаю, как нейросеть посоветовала челу в качестве заправки для салата сделать инкубатор ботулотоксина) А так у Claude советы получше и полнее, имхо.

Нажмите, чтобы раскрыть...

Я даже не знаю чей ответ "лучше". Но я бы не хотел тут играть на морфе, неприятно против лины играть на нем. Лине ничего не помешает прийти и шотнуть морфа с ульты.

StoP.IT.FroZzz...

Пользователь

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

StoP.IT.FroZzz...

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

StoP.IT.FroZzz... сказал(а):

Да похоже на гонку, где каждая новая модель на пару-тройку процентов лучше предыдущей. Думаю будут двигаться в направлении удешевления цены дальше.


Без комментариев:

chatgpt4o
Клод 3.5 соннет
Нажмите, чтобы раскрыть...
мультифрукт сказал(а):

Обе нейросети советуют Шейкера на четвёрку... Жуткое говноедство, равносильно случаю, как нейросеть посоветовала челу в качестве заправки для салата сделать инкубатор ботулотоксина) А так у Claude советы получше и полнее, имхо.

Нажмите, чтобы раскрыть...

Обновили рейтинговую таблицу на чатбот арене.

В ладдере на втором месте. Неплохо неплохо, приблизительно на уровне с gpt4o:

5Z37s4x.png

SepiaFatum

Пользователь

Регистрация: 04.09.2020

Сообщения: 13151

Рейтинг: 3102

SepiaFatum

Регистрация: 04.09.2020

Сообщения: 13151

Рейтинг: 3102

StoP.IT.FroZzz... сказал(а):

Собственно вот новость с их сайта:

https://www.anthropic.com/news/claude-3-5-sonnet

Они утверждают, что эта модель лучше GPT4o в бенчмарках, но что-то я сомневаюсь в этом. Фришная версия с лимитами есть.

Ещё не клацал.

Нажмите, чтобы раскрыть...

Круто, в бенчмарках даже ллама3 показывает результат круче гпт. Эти бенчмарки от балды сделаны.

StoP.IT.FroZzz...

Пользователь

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

StoP.IT.FroZzz...

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

SepiaFatum сказал(а):

Круто, в бенчмарках даже ллама3 показывает результат круче гпт. Эти бенчмарки от балды сделаны.

Нажмите, чтобы раскрыть...

Ты про неё?cP95SmM.png

SepiaFatum

Пользователь

Регистрация: 04.09.2020

Сообщения: 13151

Рейтинг: 3102

SepiaFatum

Регистрация: 04.09.2020

Сообщения: 13151

Рейтинг: 3102

StoP.IT.FroZzz... сказал(а):

Ты про неё?cP95SmM.png

Нажмите, чтобы раскрыть...

Да, этих бенчмарков миллиард. И в каждом свои тупые критерии. Они созданы чтобы байтить таких как ты на хайп моделек. roflanLico.png?1616515069

StoP.IT.FroZzz...

Пользователь

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

StoP.IT.FroZzz...

Регистрация: 26.08.2014

Сообщения: 8091

Рейтинг: 2587

SepiaFatum сказал(а):

Да, этих бенчмарков миллиард. И в каждом свои тупые критерии. Они созданы чтобы байтить таких как ты на хайп моделек. roflanLico.png?1616515069

Нажмите, чтобы раскрыть...

На чат бот арене слепое оценивание же.

Но накрутку голосов никто не отменял. Если разраб знает, как его модель отвечает на определенные вопросы.

prizrak cccp

Пользователь

Регистрация: 12.05.2024

Сообщения: 84

Рейтинг: 29

prizrak cccp

Регистрация: 12.05.2024

Сообщения: 84

Рейтинг: 29

StoP.IT.FroZzz... сказал(а):

Собственно вот новость с их сайта:

https://www.anthropic.com/news/claude-3-5-sonnet

Они утверждают, что эта модель лучше GPT4o в бенчмарках, но что-то я сомневаюсь в этом. Фришная версия с лимитами есть.

Ещё не клацал.

Нажмите, чтобы раскрыть...

нет