Компания OpenAI представила преемника модели искусственного интеллекта o1 – o3, предназначенную для решения умственных задач.
Главные тезисы
- Новый искусственный интеллект o3 от OpenAI приближается к уровню общего ИИ, способного эффективно решать экономические задачи, обычно выполняемые человеком.
- Модель o3 продемонстрировала рекордные результаты в различных областях, включая математику, биологию и физику, превосходя предыдущую модель o1.
- Одним из ключевых улучшений o3 является возможность настраивать режимы вычислений, обеспечивая баланс между скоростью и качеством результатов.
- Тем не менее, новая модель ИИ от OpenAI, o3, также сталкивается с некоторыми проблемами, включая сложности в решении простых задач и высокие затраты на использование передовых режимов.
- OpenAI признает потенциальные риски, связанные с новой моделью o3, и предпринимает шаги для обеспечения безопасности и минимизации возможных негативных последствий.
Что известно о новой модели ИИ от OpenAI
Компания также представила компактный вариант — o3-mini, предназначенный для решения специфических задач.
По словам разработчиков, в определенных условиях модель o3 способна приблизиться к уровню общего искусственного интеллекта, способного выполнять большинство экономических задач, обычно выполняемых человеком.
В компании отмечают, что это еще не окончательный прорыв, однако результативность o3 превосходит все предыдущие разработки.
По результатам теста ARC-AGI, оценивающего потенциал искусственного интеллекта к усвоению новых навыков вне учебной базы данных, новый ИИ от OpenAI получил 87,5% в режиме высоких вычислений.
Эти результаты оказались втрое лучше результатов предшественника — модели o1.
Модель достигла выдающихся результатов в разных тестах:
96,7% на Американском математическом экзамене 2024;
87,7% у GPQA Diamond, отвечая на вопросы уровня магистратуры по биологии, физике и химии;
Новый рекорд 25,2% в тесте Frontier Math от EpochAI, что значительно превосходит конкурентов.
Что известно о проблемах новой модели ИИ от OpenAI
При этом такие аналитики как соразработчик теста ARC-AGI Франсуа Шолле призывают не переоценивать возможности нового ИИ.
В частности, Шолле указывает, что o3 демонстрирует проблемы в решении простых задач.
Кроме этого, новый ИИ от OpenAI специалист связывает с высокими затратами на использование ее передовых режимов.
В то же время, среди наиболее важных улучшений o3 получила возможность настраивать время вычислений. Это позволяет пользователям выбирать между низким, средним и высоким режимом вычислений.
Хотя более высокий режим обеспечивает лучшие результаты, он также увеличивает задержку: ответы могут занимать от нескольких секунд до минут.
o3 использует процесс “частной цепи мышления”, внутренне анализируя задачи, раскрывая процесс решения задач и предоставляя надежные результаты в области физики, математики и программирования.
OpenAI признает потенциальные риски, связанные с o3, учитывая проблемы, обнаруженные в предыдущей модели.
Модель o1, например, продемонстрировала более высокую склонность к обману пользователей по сравнению с другими моделями. Команды OpenAI сейчас используют методику “дискриминационного согласования” для обеспечения соответствия o3 принципам безопасности.
Чтобы минимизировать риски, OpenAI сначала сделает доступным o3-mini для тестирования исследователями безопасности, тогда как o3 станет доступным позже в 2025 году.