Искусственный интеллект полностью прошёл видеоигру, хотя его этому вообще не обучали. Модель Claude 3.7 Sonnet прошла Pokemon Red 1996 года

Пару дней назад компания Anthropic представила размышляющую модель Claude 3.7 Sonnet, а позже она провела стрим, где показала, как эта модель проходит видеоигру.

ИИ играл в весьма старую и простую игру: Pokemon Red, которая вышла для Game Boy в 1996 году. Прелесть процесса была в том, что авторы показывали игровой процесс и отдельно окно с рассуждениями ИИ об этом процессе. При этом модель никто не учил играть в игры, и это впечатляет больше всего.
Хорошо видно, что ИИ в ряде задач мыслит примерно как и человек, только люди обычно такие простые мысли не осознают и не проговаривают. Некоторые действия занимали у ИИ невероятно много времени. Там, где человек справился бы за секунды, ИИ затратил минуты. Однако искусственный интеллект всё же справлялся с задачами и в итоге прошёл игру. К слову, этого не смогла сделать предыдущая версия Claude.
