OpenAI: Представляем GPT-5.3-Codex
Расширение Codex на весь спектр профессиональной работы за компьютером.
Мы представляем новую модель, которая раскрывает еще больше возможностей Codex: GPT‑5.3-Codex, самую мощную на сегодняшний день модель для агентного кодирования. Модель улучшает как передовые возможности кодирования GPT‑5.2-Codex, так и способности GPT‑5.2 в рассуждениях и профессиональных знаниях, объединяя их в одной модели, которая также на 25 % быстрее. Это позволяет выполнять длительные задачи, которые включают исследования, использование инструментов и сложное исполнение. Подобно коллеге, вы можете управлять и взаимодействовать с GPT‑5.3-Codex во время его работы, не теряя контекста.
GPT‑5.3‑Codex — наша первая модель, которая сыграла ключевую роль в создании самой себя. Команда Codex использовала ранние версии для отладки собственного обучения, управления собственным развертыванием и диагностики результатов тестов и оценок — наша команда была поражена тем, насколько Codex смог ускорить собственную разработку.
С GPT‑5.3-Codex, Codex переходит от агента, способного писать и проверять код, к агенту, который может выполнять почти всё, что разработчики и профессионалы могут делать на компьютере.
Передовые агентские возможности
GPT‑5.3-Codex устанавливает новый стандарт в отрасли на SWE-Bench Pro и Terminal-Bench и демонстрирует высокие результаты на OSWorld и GDPval — четырех бенчмарках, которые мы используем для оценки возможностей в программировании, агентных и реальных задачах.
Кодирование
GPT‑5.3-Codex демонстрирует передовые результаты на SWE-Bench Pro, строгой оценке реальной программной инженерии. В то время как SWE‑bench Verified тестирует только Python, SWE‑Bench Pro охватывает четыре языка и более устойчив к загрязнению данных, более сложный, разнообразный и релевантный для индустрии. Это также значительно превосходит прежние передовые результаты на Terminal-Bench 2.0, который измеряет навыки работы в терминале, необходимые агенту программирования, такому как Codex. Примечательно, GPT‑5.3‑Codex делает это с меньшим числом токенов, чем любая предыдущая модель, что позволяет пользователям создавать больше.
Веб-разработка
Сочетание передовых возможностей кодирования, улучшений в эстетике и сжатия приводит к модели, которая способна выполнять впечатляющую работу, создавая с нуля высокофункциональные сложные игры и приложения за считанные дни. Чтобы протестировать возможности модели в веб-разработке и длительной агентной работе, мы попросили GPT‑5.3‑Codex создать для нас две игры: вторую версию гоночной игры из запуска приложения Codex и игру для дайвинга. Используя навык develop-web-game и предварительно выбранные, универсальные последующие промпты, такие как "исправить баг" или "улучшить игру", GPT‑5.3-Codex автономно итеративно работал над играми на протяжении миллионов токенов. Посмотрите трейлеры и сыграйте в игры сами, чтобы узнать, на что способен Codex.
GPT‑5.3-Codex также лучше понимает ваши намерения, когда вы просите его создавать повседневные веб-сайты, по сравнению с GPT‑5.2-Codex. Простые или недостаточно конкретные промпты теперь по умолчанию перенаправляются на сайты с более широкими возможностями и разумными значениями по умолчанию, предоставляя вам более прочную стартовую основу для воплощения ваших идей в жизнь.
Например, мы попросили GPT‑5.3-Codex и GPT‑5.2-Codex создать две целевые страницы. GPT‑5.3-Codex автоматически показывал годовой план как ежемесячную цену со скидкой, делая скидку понятной и намеренной, вместо умножения годовой суммы. Это также создало карусель отзывов с автоматической сменой и тремя различными цитатами пользователей вместо одной, в результате чего страница по умолчанию кажется более завершённой и готовой к производству.